Práctica 7. Análisis con Voyant Tools
Míriam Estévez Madrigal
Vanessa Mollá Vidal
Víctor Romero Marcos
Elegimos varios textos literarios de un repositorio digital
Nosotros hemos seleccionado tres obras de Pío Baroja.
El árbol de la ciencia
El aprendiz de conspirador
La nave de los locos
Extraemos el texto en formato .txt en archivos independientes y los comprimimos en un archivo .zip
Accedemos a https://voyant-tools.org y subimos el archivo .zip
Observamos la nube de palabras (panel “Cirrus”) y el resumen (panel “Sumario”)
La nube de palabras creada por Voyant Tolls es la siguiente:
Con lo que respecta al resumen, nos proporciona la siguiente información.
Este corpus tiene 3 documentos con un total de 207,792 palabras y 19,986 formulario de palabra única. Creado Ahora .
Extensión del documento:
Más largo: La nave de los locos (87510)
Más corto: El aprendiz de conspirador (53694)
Densidad del vocabulario
Más alto: El aprendiz de conspirador (0.164)
Más bajo: La nave de los locos (0.140)
Promedio de palabras por oración:
Más alto: La nave de los locos (16.7)
Más bajo: El árbol de la ciencia (16.0)
Readability Index:
Más alto: La nave de los locos (7.886)
Más bajo: El aprendiz de conspirador (7.738)
Palabra más frecuente en el corpus:
Palabras diferenciadas (comparado con el resto del corpus):
El aprendiz de conspirador: leguía (208), pello (166), laguardia (75), aviraneta (185), corito (68).
El árbol de la ciencia: lulú (174), hurtado (148), aracil (69), iturrioz (68), margarita (45).
La nave de los locos: alvarito (562), manón (207), álvaro (151), ollarra (113), chipiteguy (70).
¿Qué palabras aparecen con más frecuencia?
Las palabras que aparecen con más frecuencia son a (5672); no (2859); le (1856); más (811); usted (734).
¿Coinciden con las que esperabais?
La palabra “a” sí, ya que es una preposición que se utiliza con bastante frecuencia, por lo que no sorprende que sea una de las que más aparece. Las palabras “le” y “no” también se reiteran mucho, pero “más” y “usted” nos han sorprendido más.
Usamos el panel “Tendencias” para seleccionar una o dos palabras clave.
pg47103: El aprendiz de conspirador.
pg60464: El árbol de la ciencia.
pg74566: La nave de los locos.
- ¿Dónde aparecen más a lo largo del texto?
Las palabras no aparecen en ninguna parte en especial, ya que preposiciones, conjunciones o pronombres son muy usuales en nuestro idioma y se utilizan con relativa frecuencia. Por ello, no podemos destacar alguna parte de las obras en las que se empleen con mayor frecuencia.
- ¿Qué relación tienen con la estructura narrativa?
Como ya hemos mencionado anteriormente, estas palabras con muy comunes en nuestra lengua. Por este motivo, no podemos relacionarlas con la temática ni la estructura narrativa. Sin embargo, dada la fecha de composición de las obras y el léxico que se empleaba en el momento, podemos destacar el uso de “usted”, fórmula de tratamiento formal que se empleaba muy usualmente en aquella época.
Explorad el panel “Contextos” para ver frases donde aparece una palabra importante.
Aparece el término “a” frecuentemente en las tres obras.
Redactamos una breve reflexión (4-6 líneas) respondiendo a estas preguntas:
¿Qué os ha permitido ver Voyant Tools que no habríais notado en una lectura tradicional?
Voyant Tools permite realizar un análisis muy exhaustivo de los textos que puede resultar muy útil de cara a la realización de estudios o investigaciones, algo que una lectura tradicional no permitiría, o supondría un esfuerzo y un gasto de tiempo excesivo. Además, por supuesto, nos permite observar múltiples curiosidades que pueden dar pie a la realización de actividades en el aula, concretamente en la clase de Lengua Castellana y Literatura, en las que trabajaríamos con las palabras y el uso de las mismas.
¿Qué aspectos del texto se resisten a este tipo de análisis?
Los aspectos más subjetivos, como un análisis, por ejemplo, de la literariedad. Las figuras retóricas que se emplean o que aparecen con más frecuencia, en qué contextos aparecen, etc. Sería interesante que una aplicación pudiera rescatar del mismo modo que Voyant Tools todos estos aspectos más literarios de un texto. Esto daría mucho juego en las clases de Lengua Castellana y Literatura, por ejemplo, en un ejercicio de comparación de textos, a modo de compara y contrasta.
Comentarios
Publicar un comentario