Analizando los patrones de violencia en Colombia con más de 100 bases de datos

—Valentina Rozo Ángel y Maria Gargiulo

El Estado colombiano y la guerrilla de las Fuerzas Armadas Revolucionarias de Colombia – Ejército del Pueblo FARC-EP llegaron a un Acuerdo de Paz en 2016, dentro del cual se creó la Comisión para el Esclarecimiento de la Verdad, la Convivencia y la No Repetición. El objetivo de esta institución temporal es conocer la verdad de lo ocurrido en el  marco del conflicto armado, contribuir al esclarecimiento de las violaciones e infracciones cometidas durante el mismo y ofrecer una explicación amplia de su complejidad a toda la sociedad (1).

La Comisión de la Verdad se unió con otro de los mecanismos creados en el Acuerdo de Paz, la Jurisdicción Especial para la Paz, y HRDAG en el proyecto “JEP-CEV-HRDAG de integración de datos y estimación estadística”. Este proyecto tuvo como objetivo producir información estadística oficial sobre la magnitud  y los patrones de la violencia en el marco del conflicto armado colombiano y finalizó con la publicación del Informe Final de la Comisión de la Verdad. Más información del proyecto está disponible aquí

Dentro del proyecto estimamos las víctimas del conflicto armado de desaparición forzada, desplazamiento, homicidio, reclutamiento de menores de edad y secuestro con base en 112 bases de datos. Para esto, utilizamos métodos estadísticos y de aprendizaje automático en tres grandes pasos. Primero, la vinculación de registros. En este paso deduplicamos los 12.863.977 registros de las bases de datos para evitar dobles conteos. Una vez deduplicada la información, el segundo paso fue la imputación estadística con el objetivo de subsanar el vacío de información de los “campos faltantes”. Es decir, dado que los registros suelen no tener toda la información completa, como su sexo o edad, usamos imputación múltiple sumado a unas variables de soporte basadas en una red neuronal recurrente de memoria a largo-corto plazo para imputar los campos faltantes. Por último, el tercer paso consistió en la estimación del subregistro por medio del método de estimación por sistemas múltiples Modelos de Clases Latentes Múltiples para Captura-Recaptura.

Si bien los hallazgos del proyecto fueron usados en gran parte de los capítulos del Informe Final, el capítulo “Hasta la guerra tiene límites” hace un análisis detallado. Por su parte, el “Anexo proyecto JEP-CEV-HRDAG” presenta de manera técnica los métodos utilizados en el proyecto, así como sus hallazgos. También, en las “Preguntas frecuentes” se recopilan las principales preguntas sobre el proyecto con sus respectivas respuestas. Por último, el Departamento Administrativo Nacional de Estadística, la Entidad responsable de la planeación, levantamiento, procesamiento, análisis y difusión de las estadísticas oficiales de Colombia; hizo una revisión del proyecto y publicó su concepto técnico.

¡En las próximas semanas estaremos publicando más contenido sobre este proyecto en todas nuestras redes sociales! 

Nota: El “Anexo proyecto JEP-CEV-HRDAG” aquí disponible es una versión actualizada, que corrige algunos errores de la versión disponible en la página del CEV.

===

(1) Comisión de la Verdad. 2022. ¿Qué es la Comisión de la Verdad? Disponible en: https://web.comisiondelaverdad.co/la-comision/que-es-la-comision-de-la-verdad Recuperado el 18 de agosto de 2022.


Our work has been used by truth commissions, international criminal tribunals, and non-governmental human rights organizations. We have worked with partners on projects on five continents.

Donate