Extracción de Palabras Clave de Ciberacoso de Textos Breves: un Enfoque de Aprendizaje Automático

William Hermel Astudillo Quituisaca
Priscila Cedillo
Marcos Orellana
Resumen

El ciberacoso impacta negativamente a la sociedad debido a las consecuencias que sufren las víctimas, acosadores y espectadores. El acceso generalizado a Internet y redes sociales, especialmente entre jóvenes sin herramientas para enfrentar estas situaciones, hace necesaria una formación social que mitigue los efectos del ciberacoso. Este estudio busca contribuir a esa formación mediante la creación de guiones para cápsulas educativas. Para ello, se desarrolló un modelo que automatiza la búsqueda y extracción de datos de la red social X utilizando Python y Selenium Web Driver. Tras un proceso de pre-procesamiento de textos utilizando técnicas de Procesamiento de Lenguaje Natural, se aplicó el modelo de Asignación Latente de Dirichlet (LDA) para identificar las palabras clave. Finalmente, se utilizó el modelo pre-entrenado “text-davinci-003” a través de la API de la empresa OpenAI para generar el contenido de las cápsulas educativas, asignando un contexto y utilizando las palabras clave identificadas. El resultado de esta investigación propuesta es la generación de un guion que contiene temas de educación y prevención del acoso y ciberacoso. Para garantizar una confiabilidad del texto generado por el modelo pre-entrenado generativo, se evaluó con un experto en la materia mediante el enfoque de Meta-Pregunta-Respuesta (GQM), lo que valida su potencial en la generación de contenido educativo en la lucha contra el ciberacoso.

DESCARGAS
Los datos de descarga aún no están disponibles.
Cómo citar
Extracción de Palabras Clave de Ciberacoso de Textos Breves: un Enfoque de Aprendizaje Automático. (2024). Revista Tecnológica - ESPOL, 36(E1), 25-38. https://doi.org/10.37815/rte.v36nE1.1207

Referencias

Alim, S. (2015). Analysis of tweets related to cyberbullying: Exploring information diffusion and advice available for cyberbullying victims. International Journal of Cyber Behavior, Psychology and Learning (IJCBPL), 5(4), 31–52.

Arazzi, M., Nicolazzo, S., Nocera, A., & Zippo, M. (2023). The importance of the language for the evolution of online communities: An analysis based on Twitter and Reddit. Expert Systems with Applications, 222, 119847.

Azuela, J. H. S., & Ayala, A. P. (2019). ESTADO DEL ARTE EN INTELIGENCIA ARTIFICIAL Y CIENCIA DE DATOS.

Bayari, R., & Bensefia, A. (2021). Text mining techniques for cyberbullying detection: state of the art. Adv. sci. technol. eng. syst. j, 6(1), 783–790.

Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of machine Learning research, 3(Jan), 993–1022.

Chen, K., Duan, Z., & Yang, S. (2022). Twitter as research data: Tools, costs, skill sets, and lessons learned. Politics and the Life Sciences, 41(1), 114–130.

Fatima, N., Imran, A. S., Kastrati, Z., Daudpota, S. M., & Soomro, A. (2022). A systematic literature review on text generation using deep neural network models. IEEE Access, 10, 53490–53503.

Garaigordobil, M. (2014). Cyberbullying. Screening de acoso entre iguales: descripción y datos psicométricos. International Journal of Developmental and Educational Psychology, 4(1), 311–318.

Guallar, J., & Traver, P. (2020). Curación de contenidos en hilos de Twitter. Taxonom’ia y ejemplos. Anuario ThinkEPI, 14.

Kamilali, D., & Sofianopoulou, C. (2015). Microlearning as Innovative Pedagogy for Mobile Learning in MOOCs. International Association for Development of the Information Society.

Lugones Botell, M., & Ram’irez Bermúdez, M. (2017). Bullying: aspectos históricos, culturales y sus consecuencias para la salud. Revista cubana de medicina general integral, 33(1), 154–162.

Mancilla-Vela, G., Leal-Gatica, P., Sanchez Ortiz, A., & Vidal, C. (2020). Factores asociados al éxito de los estudiantes en modalidad de aprendizaje en línea: un análisis en minería de datos. Formación universitaria, 13, 23–36. https://doi.org/10.4067/S0718-50062020000600023

Orellana, M., Zambrano-Martinez, J. L., Calle Andrade, R. M., Roldan, A., & Tirado Jarama, A. N. (2023). Generación de Texto Guía para la Detección Automatizada del Acoso y el Ciberacoso. Revista Tecnológica - ESPOL, 35(2), 181–191. https://doi.org/10.37815/rte.v35n2.1049

Peña, A., & Herrera, L. (2021). Indicadores de tecnolog’ia de la información y comunicación. Quito: INEC.

Salmivalli, C., Laninga-Wijnen, L., Malamut, S. T., & Garandeau, C. F. (2021). Bullying prevention in adolescence: Solutions and new challenges from the past decade. Journal of Research on Adolescence, 31(4), 1023–1046.

Sanchez, H., & Kumar, S. (2011). Twitter bullying detection. ser. NSDI, 12(2011), 15.

Van Solingen, R., Basili, V., Caldiera, G., & Rombach, H. D. (2002). Goal question metric (gqm) approach. Encyclopedia of software engineering.

Vázquez, A., Pinto, D., Vilariño, D., & Castro, M. (2017). Modelos para la generación automática de diálogos: Una revisión. Applications of Language & Knowledge Engineering, 163.

Vidal Ledo, M., Vialart Vidal, M. N., Alfonso Sánchez, I., & Zacca González, G. (2019). Cápsulas educativas o informativas. Un mejor aprendizaje significativo. Educación médica superior, 33(2).

Artículos similares

También puede Iniciar una búsqueda de similitud avanzada para este artículo.