Procesamiento del lenguaje natural para detectar narrativas y técnicas de propaganda en mensajes de autoridades chinas, rusas, europeas y estadounidenses

Autor principal:
Pablo Moral (Universidad Nacional de Educación a Distancia)
Programa:
Sesión 6, Sesión 6
Día: martes, 23 de julio de 2024
Hora: 15:30 a 17:15
Lugar: CLARA CAMPOAMOR (45)

El procesamiento del lenguaje natural (PLN) puede ser un aliado para la prevención de campañas de propaganda en redes sociales. Estas frecuentemente incluyen dos elementos: (1) el empleo de técnicas retóricas que apelan a las emociones y facilitan la propagación; y (2) la difusión de narrativas que ofrecen una manera coherente de interpretar la realidad.  

Esta ponencia presenta los resultados de una investigación de PLN que bebe de conceptos de comunicación política y tiene un doble objetivo. En primer lugar, detectar técnicas de propaganda, identificando mensajes hostiles, engañosos y emocionales. En segundo lugar, detectar narrativas en textos cortos (tweets), capturando agentes, acciones y argumentos que contribuyen a influenciar a las audiencias. 

Para detectar técnicas propagandísticas, primero se recopiló una lista de 14 técnicas de propaganda agrupadas en cuatro conjuntos según sus características retóricas. Luego se realizó una clasificación manual de 12000 tweets en inglés y 9500 en español, publicados por 622 autoridades diplomáticas de China, Rusia, la UE y EEUU. Posteriormente, sobre estos datos se entrenaron distintos sistemas de PLN utilizando grandes modelos de lenguaje. Para la detección de narrativas, se elaboró una lista de seis narrativas estratégicas por cada actor internacional. A continuación, se entrenaron sistemas con la descripción y varios ejemplos cada una (few-shot learning).  

Los resultados revelan la complejidad de estas tareas incluso para los modelos de vanguardia, lo que ayuda a comprender mejor su naturaleza e incentiva el desarrollo de investigaciones relacionadas.  

Además, nuestro estudio demuestra la complementariedad entre los métodos computacionales y las aproximaciones de ciencias sociales. En los últimos años el aprendizaje automático ha extendido la aplicabilidad de los marcos analíticos de campos como Relaciones Internacionales, ciencias políticas o de la comunicación a grandes bases de datos, ampliando los horizontes de estas disciplinas. Esta investigación constata que las teorías de estas ciencias sociales también impulsan la creación de nuevos desafíos computacionales. Unos desafíos que, a su vez, permiten desarrollar y evaluar nuevos sistemas en contextos inéditos. De este modo se descubren nuevas facetas de los modelos de lenguaje, ampliando nuestra comprensión sobre el procesamiento del lenguaje natural. 

Palabras clave: Procesamiento del lenguaje natural, propaganda, narrativas estratégicas, X, ciencias sociales computacionales