Por favor, use este identificador para citar o enlazar este ítem:
http://cicese.repositorioinstitucional.mx/jspui/handle/1007/4262
Identificación de sexismo en redes sociales Identification of Sexism on Social Media | |
Martha Paola Jiménez Martínez | |
Irvin Hussein Lopez-Nava Manuel Montes y Gómez | |
Acceso Abierto | |
Atribución | |
Sexismo, Redes de Atención Jerárquica, Transformers, Clasificación por Ensamble, Detección de Sexismo, Procesamiento de Lenguaje Natural (PLN), Explicabilidad, ChatGPT, Análisis Demográfico, Clasificación Multietiqueta Hierarchical Attention Networks, Transformers, Ensemble Classification, Sexism Detection, Natural Language Processing (NLP), Explainability, ChatGPT, Demographic Analysis, Multilabel Classification | |
La presente investigación aborda la detección de sexismo en redes sociales en español, empleando técnicas de procesamiento de lenguaje natural y modelos avanzados basados en transformers. Ante la escasez de recursos en español, se utilizó el corpus EXIST 2023, anotado por diversos perfiles demográficos, para analizar cómo el género y la edad influyen en la percepción y clasificación del sexismo mediante tres niveles de tareas: identificación de sexismo (clasificación binaria para determinar si un tuit es sexista), intención de la fuente (clasificación de mensajes sexistas según intención: directa, reportada o juicio), y categorización del tipo de sexismo (agrupación en categorías como ideología, estereotipos, cosificación, violencia sexual y misoginia). A través de una metodología que incluye el preprocesamiento de datos, la clasificación en tareas binarias, tanto multiclase y como multietiqueta, y el desarrollo de ensambles que incorporan perspectivas demográficas, se logró un puntaje F1 de 0.854. Además, se realizó un análisis de errores para identificar las limitaciones del modelo y se implementó ChatGPT para generar explicaciones contextuales de las predicciones, mejorando la interpretabilidad del sistema. Los hallazgos subrayan la relevancia de integrar enfoques inclusivos y técnicas de explicabilidad para abordar un problema culturalmente complejo como el sexismo en entornos digitales. Este trabajo no solo contribuye al avance en la detección de lenguaje discriminatorio en español, sino que también establece bases para desarrollar sistemas m´as justos y transparentes en tareas críticas de análisis textual. The present research addresses the detection of sexism on Spanish-language social media using natural language processing techniques and advanced transformer-based models. Given the scarcity of resources in Spanish, the EXIST 2023 corpus, annotated by diverse demographic profiles, was utilized to analyze how gender and age influence the perception and classification of sexism across three task levels: Sexism identification (binary classification to determine if a tweet is sexist), source intent (classification of sexist messages based on intent: direct, reported, or judgmental), and categorization of sexism type (grouping into categories such as ideology, stereotypes, objectification, sexual violence, and misogyny). Through a methodology encompassing data preprocessing, binary, multiclass, and multilabel classification tasks, and the development of ensembles incorporating demographic perspectives, the study achieved an F1 score of 0.854. Additionally, an error analysis was conducted to identify the model’s limitations, and ChatGPT was implemented to generate contextual explanations of predictions, enhancing the system’s interpretability. The findings highlight the importance of integrating inclusive approaches and explainability techniques to address a culturally complex issue like sexism in digital environments. This work not only contributes to advancements in the detection of discriminatory language in Spanish but also establishes foundations for developing fairer and more transparent systems in critical text analysis tasks. | |
CICESE | |
2025 | |
Tesis de maestría | |
Español | |
Jiménez Martínez, M.P. 2025. Identificación de sexismo en redes sociales. Tesis de Maestría en Ciencias. Centro de Investigación Científica y de Educación Superior de Ensenada, Baja California. 77 pp. | |
ORDENADORES ANALÓGICOS | |
Aparece en las colecciones: | Tesis - Ciencias de la Computación |
Cargar archivos:
Fichero | Descripción | Tamaño | Formato | |
---|---|---|---|---|
tesis_Martha Paola Jiménez Martínez_2025.pdf | Descripción completa de la tesis | 1.28 MB | Adobe PDF | Visualizar/Abrir |