Detección automática de usos de especies mexicanas basada en extracción terminológica
Resumen
Una enorme cantidad de conocimiento sobre el patrimonio ecológico mexicano se encuentra en la literatura y a pesar de los esfuerzos de la CONABIO, para mantener registro de este conocimiento, la necesidad de utilizar métodos automatizados para extraer la información pertinente de manera eficaz es inminente. En esta presentación se discute el desarrollo metodológico, de un proyecto en curso en el cual se detectarán, automáticamente, fragmentos textuales que hablen acerca de los usos de especies mexicanas.
La propuesta toma como base diversos lexicones curados manualmente en proyectos anteriores en la CONABIO: nombres comunes de especies, nombres científicos, partes de plantas y animales, términos en lenguas autóctonas, nombres de instrumentos de caza y de pesca, nombres de padecimientos en comunidades indígenas, de prácticas terapéuticas, entre otros. Al combinar dichas unidades léxicas con un tipo de patrón sintáctico, conocido en el área de extracción terminológica como predicación verbal definitoria, hemos podido detectar cerca de veinticinco mil fragmentos textuales que, potencialmente, hablan del uso de especies mexicanas. Finalmente, discutiremos algunos de los resultados así como perspectivas para etapas subsecuentes. //// Alejandro Molina Villegas, ( amolina@conabio.gob.mx ). Es Maestro en Ciencias de la Computación por la UNAM y Doctor en Informática por Université d'Avignon et des Pays de Vaucluse.
Es un joven investigador en áreas relacionadas con Minería de Datos y métodos estadísticos aplicados al procesamiento del lenguaje. Ha colaborado con grupos reconocidos internacionalmente como el Laboratoire Informatique d'Avignon, el Parsing & Semantics group at Xerox Research Centre Europe, el Institut Universitari de Lingüística Aplicada y el Grupo de Ingeniería Lingüística de la UNAM. Actualmente coordina la primera biblioteca de software para la minería de textos de Biodiversidad mexicana.
Palabras clave: Facultad de Filosofía y Letras; Lingüística Computacional; Tecnologías del Habla; Aplicaciones tecnológicas; Extracción terminológica; Conferencia en audio; Patrimonio ecológico mexicano; Lexicones; Patrones sintácticos; Predicción verbal definitoria;
Descripción
Conferencia /// Detección automática de usos de especies mexicanas basada en extracción terminológica. Alejandro Molina Villegas. Comisión Nacional para el Conocimiento y Uso de la Biodiversidad. 25 de agosto de 2015 //// VII Coloquio de Lingüística Computacional en la UNAM. Semestre 2016-1. Facultad de Filosofía y Letras. Universidad Nacional Autónoma de México //// Descarga: Pulse botón derecho del ratón sobre el archivo de audio "mp3" que elija y seleccione "Guardar Destino Como..."
Editorial
Facultad de Filosofía y Letras. Instituto de Ingeniería. Universidad Nacional Autónoma de México
Patrocinio
Consejo Nacional de Ciencia y Tecnología CONACyT
Colecciones
El ítem esta asociado a una licencia: