Optimización de una técnica de evaluación para un sistema de extracción automática de ejemplos

Autor
Lázaro Hernández, Jorge Adrián
Douriet Espinoza, Esther
Fecha
2015Metadatos
ítem / registro completoResumen
En esta presentación se mostrará la optimización de la propuesta denominada densidad lexicométrica (Lázaro, 2015), una medida que calcula la cercanía semántica de una oración con respecto a una definición para determinar si se puede considerar ejemplo. Está dada por:
scorei= cos (sentencei, q) x 1/log〖| sentencei|〗
que básicamente es el cálculo del coseno de una frase por el logaritmo inverso de su longitud. Esto significa que las frases más cortas y con mayor contenido semántico, obtenido de la definición, son las más aptas para considerarse ejemplo.
Estos ejemplos se refieren a un concepto especializado y por lo tanto contienen siempre un término como núcleo. La optimización consiste en hacer un cálculo paralelo y complementario donde los elementos satelitales al término en el candidato a ejemplo, las palabras de contenido, obtienen una calificación dependiendo de su cercanía semántica con dicho término a través del cálculo de su información mutua (Ward-Church&Hanks, 1990), con base en el corpus de donde son extraídas, y de la distancia, de acuerdo con su posición, que guarden con respecto a éste en la frase que forman. Los resultados ayudarán a que el sistema GENEX (Générateurd’examples), discierna mejor sobre la pertinencia de un ejemplo u otro para asociarlo al concepto que es representado por el término.
Las técnicas de procesamiento de lenguaje natural utilizadas se basan en la utilización de patrones sintácticos para el reconocimiento de los elementos que conforman una ontología (clases, instancias y relaciones) y además, se hace uso de las dependencias gramaticales entre palabras para la determinación de los elementos que integran una relación de tipo no taxonómica. //// Jorge Adrián Lázaro Hernández, ( jlazaroh@iingen.unam.mx ). Es maestro en Lingüística Aplicada por la Universidad Pompeu Fabra de Barcelona, donde actualmente estudia su doctorado en Lingüística. Es miembro del Grupo de Ingeniería Lingüística del Instituto de Ingeniería de la UNAM. //// Esther Douriet Espinoza, ( esther.douriet.espinoza@gmail.com ). Es egresada de la licenciatura en Lengua y Literaturas Hispánicas de la Facultad de Filosofía y Letras de la Universidad Autónoma de Sinaloa.
Palabras clave: Aplicaciones tecnológicas; Lingüística Computacional; Tecnologías del Habla; Facultad de Filosofía y Letras; Densidad lexicométrica; Conferencia en audio; Palabras de contenido; Medidas estilométricas; GENEX; Extracción automática de ejemplos;
Descripción
Conferencia /// Optimización de una técnica de evaluación para un sistema de extracción automática de ejemplos. Jorge Lázaro. Esther Douriet. Universitat Pompeu Fabra. Universidad Autónoma de Sinaloa. 25 de agosto de 2015 //// VII Coloquio de Lingüística Computacional en la UNAM. Semestre 2016-1. Facultad de Filosofía y Letras. Universidad Nacional Autónoma de México //// Descarga: Pulse botón derecho del ratón sobre el archivo de audio "mp3" que elija y seleccione "Guardar Destino Como..."
Editorial
Facultad de Filosofía y Letras. Instituto de Ingeniería. Universidad Nacional Autónoma de México
Patrocinio
Consejo Nacional de Ciencia y Tecnología CONACyT
Colecciones
El ítem esta asociado a una licencia: