Inicio / Entrada de Blog / Desarrollan una aplicación informática que muestra las evoluciones de la lengua inglesa en los siglos XVIII y XIX

Desarrollan una aplicación informática que muestra las evoluciones de la lengua inglesa en los siglos XVIII y XIX

Desarrollan una aplicación informática que muestra las evoluciones de la lengua inglesa en los siglos XVIII y XIX
Foto: Ted Underwood. El gráfico muestra el acusado incremento del uso de palabras informales del Inglés Antiguo en la literatura después de 1800.

El Profesor Underwood, de la Universidad de Illinois, trabaja ya para ampliar su campo de observación hasta la totalidad de títulos publicados en esa época.

Por el momento, el Profesor de Inglés de la Universidad de Illinois Ted Underwood ha completado un proyecto de investigación sobre la evolución de la lengua inglesa a partir del estudio de más de 4.200 libros. Sin embargo, puesto que sus resultados revelan cambios espectaculares en este idioma entre los siglos XVIII y XIX, ahora ha ampliado su investigación hasta incluir más de 470.000 títulos, casi todos los escritos en inglés durante esa época que se conservan en una biblioteca universitaria. Con el fin de lograrlo, Underwood ha desarrollado una aplicación informática que le permita llevar a cabo esta amplia comparación y obtener conclusiones científicas.

Para conseguir la herramienta que le facilitara clasificar muchos más libros de los que podría leer durante su trabajo inicial, Underwood ha trabajado con el Instituto de Computación en Humanidades, Artes y Ciencias Sociales (I-CHASS) de la U. of I. y con el Centro de Investigación HathiTrust (fruto de la colaboración de la U. of I. y de la Universidad de Indiana) para desarrollar programas informáticos gracias a los que poder revisar las copias digitalizadas de los libros contando sus palabras y clasificando sus géneros. La alianza para el estudio de los datos le ha ofrecido al investigador algunos tesoros. “De forma creciente, estoy encontrando que hay grandes patrones que descubrir en la historia de la literatura a gran escala. Sólo necesitamos tener la capacidad para alejarnos lo suficiente como para encontrarlos”, asegura.

El propósito inicial de la investigación era el de confirmar su impresión de que, alrededor de 1800, la lengua inglesa adquirió algo de rigidez. “Hay una dicción latina que se fija en torno a esa época y yo tenía la vaga sensación de que el inglés escrito se volvió más formal en ese momento histórico. Por ejemplo, ya no se decía ‘necesitar’ algo, sino ‘requerir’ algo”, revela el autor.

Underwood ha empleado datos de Google Books para encontrar las 10.000 palabras más frecuentemente utilizadas en los libros de esos siglos (sin contar los determinantes, las preposiciones, las conjunciones y los pronombres). Valiéndose de un rastreador de Internet y de la web dictionary.com, rastreó la etimología de cada una de esas 10.000 palabras, clasificándolas según la fecha de su incorporación a la lengua inglesa, y dividiéndolas después en dos grupos: pre y post Conquista de Normandía. La invasión de 1066 convirtió el francés en la lengua oficial británica, empleada (junto al Latín) para todos los escritos de negocios y conversaciones de la clase dominante. El Inglés Antiguo vernáculo, hablado por las clases más bajas, sobrevivió, pero aunque unos 200 años después recuperó su lugar como lengua oficial, el vocabulario empleado para los negocios y el gobierno se había perdido y había sido reemplazado por términos franceses y latinos. “Fue una burda pero eficaz manera de asesinar el formalismo”, asegura Underwood.

Utilizando el siglo XII como línea divisoria, el investigador trazó la separación entre los términos formales y los informales incluidos en los libros cada año entre 1700 y 1899. La gráfica resultante confirma su hipótesis, aunque de forma muy ajustada. “Hay más términos latinos en torno a 1800 –confirma-, pero es un fenómeno muy aislado”.

Cuando clasificó los libros por géneros, no obstante, el resultado resultó muy sorprendente. Mientras el lenguaje de los trabajos de no ficción se hacía, de hecho, más formal, el empleado para la ficción, el teatro, y especialmente la poesía, se volvió más formal hasta alrededor de 1775, pero después recorrió el trayecto inverso y progresivamente empleó el vocabulario menos formal de la época pre Conquista de Normandía. Hacia 1899, las palabras del Inglés Antiguo empleadas en el teatro y la ficción registraban una proporción una vez y media mayor que en no ficción, de acuerdo con los datos de Underwood. En poesía, la ratio era al menos tres veces mayor.

Este gran cambio coincide con el surgimiento del estilo de redacción que ahora conocemos como Literatura, es decir, una escritura que se establece aparte, al servicio de una intención imaginativa. “Si regresamos a 1700, la literatura significaba básicamente cualquier cosa escrita –lo que ahora sería “literal”-. Nuestro concepto de la Literatura como una ficción estética surge realmente a finales del siglo XVIII”, explica Underwood. “Creo que el mayor descubrimiento con el que me he topado es cómo el género literario cambia partiendo de la prosa de no ficción”, confiesa.

En su artículo “El surgimiento del estilo literario”, publicado en el Journal of Digital Humanities, Underwood y el co-autor y estudiante de posgrado de la U. of I. Jordan Sellers, explican su descubrimiento y teorizan acerca de por qué la literatura, considerada como la más artística forma de la escritura, adoptó el vocabulario más simple. “De algún modo, la poesía se convirtió en algo más especializado de lo que había sido hasta entonces: su estilo se volvió más alejado de la prosa. Pero se especializó empleando para ello las antiguas palabras, que podían parecer sencillas, comunes y universales”, afirman.

Underwood sospecha que la “literatura” como la conocemos evolucionó para servir como expresión de las experiencias individuales, dejando para los escritores de no ficción el análisis de las ideas abstractas y las estructuras sociales. “Para mí, la disminución del formalismo en la lengua literaria fue un efecto colateral de su énfasis por lo elemental y lo personal”, afirma.

El primer paso que Underwood ha dado para llevar a cabo la nueva fase de clasificación por géneros de los 470.000 volúmenes ha sido crear un programa que clasifica automáticamente los textos basándose en un patrón de palabras, similar al que utilizan los filtros anti spam en el correo electrónico. De todas formas, el científico está afinando y perfeccionando el proceso. “Los géneros han cambiado a lo largo del tiempo, y sus límites son difusos. Es por eso por lo que los humanistas son recelosos acerca de la nitidez de las soluciones informáticas para problemas que son tan poco claros. Pero podemos inventar sistemas que eliminen algunas de esas incertidumbres”, afirma.

Emplear programas informáticos para analizar la escritura creativa es una rama de las humanidades digitales, un campo tan nuevo que todavía despierta mucha controversia en ciertos círculos. “Creo que los más academicistas lo contemplan con una mezcla de expectación y miedo, pero lo que yo estoy intentando es crear herramientas que harán más fácil para otros investigadores utilizar las grandes colecciones de títulos en sus estudios de campo”, concluye Underwood, quien comparte todos sus datos, procesos y programas a través de su blog The Stone and the Shell (www.tedunderwood.com). Su bitácora toma su nombre del poema épico de Wordworth “El Preludio”, en el que están representadas la poesía y las matemáticas.

 
(Sin votaciones)
Cargando…