Proyecto

Descripción del proyecto

Este proyecto surge de la Tesis para obtener el Título Profesional de Ingeniería de Sistemas, titulado «Comparación de Modelos de Clasificación para detectar Ciberbullying en Twitter en el Lenguaje Español-Peruano»

Esta investigación aborda la detección de ciberbullying en Twitter, enfocado en el español peruano, mediante la creación de un dataset y la comparación de cuatro modelos de machine learning. Con un enfoque integral, busca superar la falta de estudios centrados en las particularidades lingüísticas de América Latina y el Caribe (ALAC). Su objetivo es proporcionar resultados que contribuyan a desarrollar estrategias más efectivas para combatir el ciberbullying en la región.

Antecedentes

En un contexto cada vez más digitalizado, el fenómeno del ciberbullying emerge como una preocupación social significativa, afectando a múltiples grupos y comunidades. En el caso específico de ALAC, la falta de investigaciones y la complejidad del lenguaje regional plantean desafíos adicionales en la detección y prevención eficaz del ciberbullying. Este proyecto surge como respuesta a esta problemática, buscando comprender las peculiaridades lingüísticas y culturales que influyen en la dinámica del ciberbullying en Perú, con el objetivo de desarrollar estrategias efectivas para combatir este problema y promover entornos digitales más seguros y saludables.

Comparativa de Modelos de Machine Learning para la Detección de Ciberbullying en Twitter en Español Peruano

Este estudio ofrece una comparativa entre cuatro modelos de machine learning para la detección de ciberbullying en Twitter, con un enfoque específico en el español de Perú. Utiliza un dataset diseñado especialmente para el entrenamiento de estos modelos. Además, presenta resultados detallados sobre el rendimiento de cada modelo y su capacidad para identificar el ciberbullying.


Manual: Creación y Validación de un Dataset para la Detección de Ciberacoso en el idioma Español Peruano

Este manual aborda los desafíos lingüísticos asociados a la creación de datos para abordar problemas sociales en el entorno digital de ALAC, con especial atención al español de Perú. Describe en detalle el proceso de creación y validación de un dataset específico para esta tarea, enfrentando las complejidades del lenguaje regional. Además, proporciona una exhaustiva explicación sobre el pre-procesamiento de datos mediante técnicas de procesamiento de lenguaje natural para mejorar la efectividad de la detección.

Objetivo General

Contribuir a la mejora de la detección del ciberbullying en el entorno digital de ALAC, mediante la creación de recursos y la evaluación de modelos de machine learning.

Objetivos Específicos

1. Desarrollar un manual detallado que describa el proceso de creación y validación de un dataset específico para la detección de ciberbullying en el español peruano, considerando las complejidades lingüísticas y sociales de la región.

2. Evaluar el rendimiento de cuatro modelos de machine learning en la detección de ciberbullying en Twitter, utilizando un dataset diseñado para reflejar adecuadamente las características del lenguaje y las interacciones en línea en ALAC.

3. Proporcionar resultados detallados sobre la efectividad de los modelos evaluados, destacando sus fortalezas y limitaciones, con el objetivo de informar y orientar futuras investigaciones y estrategias de intervención en el ámbito del ciberbullying en la región.

Hallazgos y Resultados Alcanzados

Comparativa de Modelos de Machine Learning para la Detección de Ciberbullying en Twitter en Español Peruano

  • El estudio abordó la falta de investigaciones sobre el ciberbullying en ALAC, enfocándose en el español de Perú y comparando cuatro modelos de machine learning para su detección en Twitter.
  • Los análisis revelaron que los modelos de machine learning basados en representación semántica superaron a los basados en sintaxis, resaltando la importancia de comprender el contexto y significado del lenguaje en la detección del ciberbullying. 
  • La exploración del impacto de emoticonos y jergas en la detección del ciberbullying abre nuevas vías de investigación y desarrollo tecnológico. Estas consideraciones enriquecen nuestra comprensión del comportamiento en línea y orientan el diseño de herramientas y políticas futuras para abordar la violencia digital de manera más efectiva.

Manual: Creación y Validación de un Dataset para la Detección de Ciberacoso en el idioma Español Peruano

  • Se creó un dataset específico para la detección de ciberbullying en el español peruano, lo que representa un avance significativo en la disponibilidad de recursos para abordar este problema en la región de ALAC.
  • Se validó el contenido del dataset mediante la participación de expertos en la problemática, a través de una aplicación web. Este proceso garantiza la calidad y relevancia de los datos utilizados para el entrenamiento de los modelos.
  • Se identificaron los desafíos lingüísticos inherentes al español peruano, lo que permitió diseñar un dataset que refleje las complejidades del lenguaje regional y las interacciones en línea.
  • Se aplicaron técnicas avanzadas de procesamiento de lenguaje natural para pre-procesar los datos, mejorando así la efectividad en la identificación del ciberbullying.

Impacto y Conclusiones

Los hallazgos de esta investigación tienen un impacto significativo en la comprensión y la respuesta al ciberbullying en el contexto de ALAC. 

El manual sobre la creación y validación de un dataset específico para la detección de ciberbullying en el español de Perú proporciona una herramienta fundamental para abordar este problema en la región, superando los desafíos lingüísticos y facilitando estrategias más efectivas de intervención. 

Por otro lado, la comparativa de modelos de machine learning para la detección de ciberbullying en Twitter destaca la importancia de investigaciones específicas para ALAC, evidenciando la eficacia de estos modelos y señalando áreas de mejora, como la consideración de emoticonos y jerga local. 

En conjunto, estos proyectos contribuyen a un enfoque más holístico y culturalmente sensible para enfrentar el ciberbullying en la región, promoviendo la seguridad digital para todas y todos.

ES
Scroll to Top