Corpus de temas sensibles: el futuro de IA

La mayoría de temas sensibles no son comúnmente indexados en sistemas automatizados. La mayoría de empresas no cuentan con un equipo dedicado a la tarea complicada de determinar que documento habla de una manera digna sobre temas como violencia, femicidio, violencia generalizada, etc. En la ultima década, los grandes avanzes en tareas tradicionales del Procesamiento […]

Read More →
Agrupaciones de tokens en el corpus de Violencia

Un corpus (o aglomeración de textos) sobre la violencia de México no existe con finalidad de uso para aplicaciones PLN. El corpus de SugarBear AI recopilado desde mediados del 2020 y el cual se continua alimentando con analistas con especialidades en psicología. Identificamos aquí los diferentes ‘NGrams’. Un ‘N-Gram’ es un token o series de […]

Read More →
Descripción de propiedades de corpus

Este corpus contiene menciones de ‘violencia’, los cuales fueron encontrados por analistas universitarios del IPN y UNAM con licenciaturas en psicología y leyes, respectivamente. Los documentos tienen referencias a distintos tipos de incidentes violentos que son aun mas específicos. Violencia Violencia de género Violencia Institucional Violencia policíaca Violencia sexual Alerta de Violencia de Género Violencia […]

Read More →