Inicio / Ciencia / Crean nuevos sistemas para detectar palabras clave lingüística computacional

Crean nuevos sistemas para detectar palabras clave lingüística computacional

EFEFUTURO.- La doctora de la Universidad de Huelva Noa Cruz, del Departamento de Tecnologías de la Información, ha desarrollado nuevos sistemas de aprendizaje automático que permiten la detección de palabras claves en lingüística computacional.

Hola Mundo en Lenguaje C
El trabajo se enmarca en la investigación “detección de la negación y la especulación en textos médicos y de opinión“, que se centra en los dos dominios en los que la negación y la especulación como información lingüística han recibido más atención: el biomédico y el de los artículos de opinión, ha informado la UHU en una nota.

El trabajo ha obtenido el primer premio en la XIII Edición de los Premios SEPLN (Sociedad Española para el Procesamiento del Lenguaje Natural) a la Investigación en Procesamiento del Lenguaje Natural, cuyo objetivo es la promoción y divulgación de la investigación en este campo.

En el campo biomédico, el método propuesto mejora los resultados obtenidos hasta la fecha para la sub-colección de documentos clínicos del llamado corpus Bioscope, que integra todo el conocimiento exacto dentro del ámbito de la investigación biomédica. En el segundo, la novedad de la investigación radica en que aporta el primer sistema entrenado y evaluado en la colección de artículos de opinión Simon Fraser University anotado con información negativa y especulativa, al tiempo que supone el primer intento en detectar la especulación en este dominio.

Según la investigadora onubense, ingeniera informática, “se trata de identificar a nivel de la frase los tokens o unidades básicas del lenguaje (números, signos de puntuación, palabras, etc.) que se ven afectados por las palabras claves de negación y especulación”.



En cuanto al ámbito biomédico el trabajo de Cruz supone el primer estudio de evaluación comparativo de tokenizadores, por lo que aporta una información de enorme utilidad para desarrolladores de PLN a la hora de elegir las herramientas de tokenización más apropiadas como primera fase de cualquier tarea de lo que en lingüística computacional se denomina minería de texto.

El desarrollo de nuevos sistemas de aprendizaje automático que propone este trabajo podría beneficiar a muchas de las aplicaciones que el campo de la lingüística computacional pone al servicio de los estudios científicos.
(Sin votaciones)
Cargando…