Análisis de tweets durante las elecciones generales 2023 en Argentina
Metodología
Para llevar acabo este análisis de datos, Data Crítica analizó los datos recolectados por Chequeado. El periodo de los tweets recolectados abarca desde 30-09-2023
hasta 2023-11-20
.
Los textos de los tweets fueron clasificados programáticamente utilizando un modelo de machine learning con la librería de Python transformers
para generar etiquetas con tipos de discursos de odio.
El modelo utilizado para este etiquetado lleva por nombre beto-contextualized-hate-speech
en Hugging Face y fue elegido ya que está entrenado con datos recolectados en el contexto de Argentina.
Este modelo tiene 9 clasificaciones distintas:
Etiqueta | Descripción |
---|---|
WOMEN | En contra de mujeres |
LGBTI | En contra LGBTI |
RACISM | Racista |
CLASS | Clasista |
POLITICS | Debido a política |
DISABLED | Ableista |
APPEARANCE | En contra debido a su apariencia |
CRIMINAL | En contra de criminales |
CALLS | Llamado a la violencia |
Jupyter Notebooks creados por Fernanda Aguirre