Manual: Creación y Validación de un Dataset para la Detección de Ciberacoso en el idioma Español Peruano

Este manual se centra en los desafíos lingüísticos inherentes a la creación de datos para abordar problemas sociales en el entorno digital de América Latina y el Caribe (ALAC), con énfasis en el caso de Perú. Detalla el proceso de creación y validación de un dataset específico para la detección de ciberbullying, enfrentando las complejidades del lenguaje regional. Además, ofrece una explicación exhaustiva sobre el pre-procesamiento de datos utilizando técnicas de procesamiento de lenguaje natural, destinadas a mejorar la efectividad en la identificación del ciberbullying. Este manual busca contribuir a la disponibilidad de recursos específicos para ALAC, facilitando así estrategias más efectivas para abordar el ciberbullying en la región.

Descarga en Español

Download in English

Referencia

Cuzcano, X.M., & Victor, H. (2020). A Comparison of Classification Models to Detect Cyberbullying in the Peruvian Spanish Language on Twitter. International Journal of Advanced Computer Science and Applications, 11. http://dx.doi.org/10.14569/IJACSA.2020.0111018