De textos a mapas: integración de PLN y geo tecnologías en un caso de análisis espacial de emociones en Colombia con datos de X (Twitter)
Contenido principal del artículo
Resumen
Este artículo analiza cómo los datos textuales provenientes de redes sociales pueden transformarse en información geográfica para comprender fenómenos sociales en el espacio. Se propone una metodología que integra el Procesamiento de Lenguaje Natural (PLN), en particular el Reconocimiento de Entidades Nombradas (REN) y la detección automática de emociones (AE), con herramientas de análisis espacial y cartografía digital. El caso de estudio se centra en Colombia y emplea una base de datos de aproximadamente 27 millones de tuits. A partir de estos, se identifican entidades de localización y emociones expresadas en los mensajes. Para ello, se desarrollan dos corpus etiquetados —uno de localizaciones y otro de emociones— junto con modelos especializados adaptados al contexto del español de Colombia. Asimismo, se calcula el índice de Moran para identificar patrones espaciales en la distribución emocional. Como resultado, se obtiene una base de datos geolocalizada de 3,8 millones de tuits con referencias espaciales, en la que se observa una correlación espacial moderada (p < 0,01) para cada emoción analizada (ira, tristeza, felicidad, disgusto, miedo y sorpresa) en Colombia. Adicionalmente, se evidencia una mejora en la exactitud de los modelos REN (44,60 % → 97,26 %) y AE (41,82 % → 72,66 %). La investigación aporta evidencia empírica al campo de la geografía de las emociones y muestra el potencial de integrar PLN y geotecnologías en estudios socioespaciales. Asimismo, ofrece aportes metodológicos replicables en otros contextos, donde la convergencia entre datos no estructurados y análisis espacial constituye una oportunidad para nuevas aproximaciones interdisciplinarias en la geografía contemporánea.
Descargas
Detalles del artículo

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.
Investigaciones Geográficas se publica bajo licencia Creative Commons Atribución-No Comercial, que permite compartir (copiar y redistribuir el material en cualquier medio o formato) y adaptar (remezclar, transformar y crear a partir del material).
Con la concesión de esta licencia, los investigadores conservan todos sus derechos de autor y, por lo tanto, pueden hacer uso del trabajo como lo estimen adecuado.
Mayor información: http://www.creativecommons.mx/

