From Political Manifestos to Social Networks: the automation of Political Discourse Analysis using Contextual Information
Directed by: Aitor Almeida
Universidad de Deusto
Cum Laude by unanimity
International Mention
Due to the rise of the social networks, political parties and politicians have found new ways of establishing their position on an issue apart from traditional political manifestos. From this phenomenon, a new research area has emerged, the automation of political discourse analysis on Social Networks. To do so, this PhD dissertation has taken advantage of a widely used content analysis methodology for political manifestos, The Manifesto Project. With annotated manifestos since 2001, this methodology uses a codification which allows the analysis of political parties policy preferences regarding 56 topics, providing the scientific community with parties’ policy positions derived from the content analysis.
Therefore, this PhD dissertation focuses on two main tasks: firstly, to automate the annotation process of political manifestos, in order to facilitate that same process to political scientists and secondly, to use this model as a basis to perform a political discourse analysis on Twitter using the previously mentioned Manifesto Project's methodology. To do so, we have taken advantage of two types of contextual information available in the two circumstances of the application of this research work: manifestos and Twitter. The first contextual data is what has been said previously, in the case of election manifestos the previous phrase or statement, and on twitter the preceding tweet. The second contextual information is which political party is the sender of the statement.
Regarding the use of contextual information in order to improve manifestos automated classification, we have improved state of the art results in 4 out of 7 languages. With regard to Tweets' classification, we can affirm that annotated manifestos can be used as complementary data for this task, being the fine-tuned model with annotated tweets the best performing one. Moreover, contextual information does also improve the performance of the models when tweets are classified. Using this approach, we have analysed the 2016 United States presidential elections on Twitter.
Debido al auge de las redes sociales, los políticos y sus respectivos partidos han encontrado nuevas formas de dar a conocer su posición sobre cualquier tema, en otros lugares que no son los programas electorales. De este fenómeno, ha emergido una nueva área de investigación, la automatización del análisis del discurso político en redes sociales. Para ello, en esta tesis doctoral se hace uso de una metodología diseñada por el Manifesto Project para el análisis de contenido en programas electorales. Con programas manualmente anotados desde 2001, este proyecto propone una codificación que permite identificar las preferencias políticas de los partidos políticos con respecto a 56 categorías diferentes, proveyendo a la comunidad científica las posiciones de estos partidos tras aplicar técnicas de análisis de contenidos.
Por tanto, esta tesis doctoral se centra es dos tareas: primero, automatizar el proceso de anotación de programas electorales, para así facilitar este mismo trabajo a los politólogos y segundo, usar este modelo como base para analizar el discurso político en redes sociales usando la metodología del Manifesto Project. Para ello, hemos usado el contexto disponible en las dos circunstancias donde se va a aplicar esta investigación: los programas electorales y Twitter.
El primer tipo de contexto usado es qué se ha dicho anteriormente, en el caso de los programas la frase o afirmación previa y en Twitter el tuit anterior. El segundo es el partido político que ha realizado la afirmación.
Respecto al uso de información contextual para mejorar la clasificación automática de programas electorales, hemos mejorados los resultados del estado del arte en 4 de 7 idiomas. Con respecto a la clasificación de tuits, podemos afirmar que los programas electorales anotados puede ser usados como información complementaria para esta tarea, siendo el modelo reentrenado con tuits anotados el que mejor resultados obtiene. Además, la información contextual también mejora el rendimiento del modelo. Por último, usando este mismo enfoque, hemos analizado las elecciones presidenciales estadounidenses de 2016 en Twitter.