Inicio / Entrada de Blog / Idean un sistema que permite identificar la semántica de las palabras a partir de su conectividad

Idean un sistema que permite identificar la semántica de las palabras a partir de su conectividad

 

 

Científicos brasileños hacen posible identificar el significado de palabras con múltiples significados sin utilizar su contexto semántico.

Dos físicos brasileños han ideado un método que dilucida automáticamente el significado de palabras que tienen varios sentidos. El procedimiento está basado únicamente en sus patrones de conectividad con las palabras que tiene cerca en una frase concreta, y no en la semántica. Thiago Silva y Diego Amancio, de la Universidad de Sao Paulo, revelan, en un trabajo publicado en EPJB (European Physical Journal B) bajo el título Discriminating word senses with tourist walks in complex networks, cómo modelaron los textos clásicos como una red compleja con la intención de deducir sus significados. Este tipo de modelo desempeña un rol clave en varias tareas naturales para el procesamiento del lenguaje, como la traducción automática, la recuperación de información, el análisis de contenidos o el proceso de textos.

En este estudio, los autores eligen un grupo de diez palabras calificadas de polisémicas, es decir, con varios significados que pueden ser empleados de forma aleatoria dependiendo del contexto, como ‘oso’ (‘bear’), ‘mermelada’ (‘jam’), ‘sólo’ (‘just’), ‘roca’ (‘rock’) o ‘presente’ (‘present’). Luego verificaron sus patrones de conectividad con las palabras que tenían cerca en textos de clásicos literarios tales como ‘Orgullo y Prejuicio’ de Jane Austen. Específicamente, establecieron un modelo que consiste en un grupo de nodos que simbolizan las palabras conectadas por sus ‘límites’ si son adyacentes en el texto.

A partir de ese momento compararon los resultados de su ejercicio de desambiguación con una serie de aproximaciones llevadas a cabo a partir de las normas de funcionamiento de la semántica tradicional. Observaron que había cuotas muy significativas de exactitud en la identificación de los significados adecuados cuando empleaban ambas técnicas. La aproximación descrita en este estudio, basada en un supuesta caracterización determinística de un ‘tourist walk’, puede por tanto, ser considerada un método complementario para distinguir entre los diferentes significados que tenga una misma palabra.

En futuros trabajos, lo autores prevén idear nuevas medidas para conectar no sólo las palabras adyacentes, sino también aquellas otras que se encuentran dentro de un determinado intervalo para aumentar la capacidad del modelo para comprender el modelo semántico. Esta aproximación se apoya, además, en otros trabajos recientes de los mismo autores en los que se muestra que las complejas medidas de las redes tradicionales dependen, fundamentalmente, de la sintaxis.

 

Pie de foto: Los autores utilizaron el texto de ‘Orgullo y Prejuicio’ de Jane Austen para ratificar los hallazgos de su teoría.
(Sin votaciones)
Cargando…