La estadística de mortalidad del conflicto en Perú

Nuestro artículo “Realidad y riesgo: refutación del análisis del estudio de mortalidad de la Comisión de la Verdad y Reconciliación por S. Rendón” ha salido publicado en Research and Politics el viernes 22 de marzo, 2019 (copia en inglés aquí).

Como su título indica, en ese artículo respondemos a una crítica del estudio de mortalidad que realizamos para la Comisión de la Verdad y Reconciliación (CVR) en 2003. En ese estudio presentamos estimaciones del número total de víctimas causadas por Estado Peruano y a las guerillas de Sendero Luminoso durante los años del conflicto armado interno en el Perú, entre 1980 y 2003.

Creemos que tanto el análisis como los resultados de Rendón son incorrectos. Como expresamos en nuestro blogpost anterior:

Nos basamos en tres razones:

(i) sus resultados contradicen los datos disponibles: los resultados de Rendón arrojan un número de víctimas menor que el número de víctimas *documentadas* en la actualidad. Esto significa que los resultados de Rendón son incorrectos;

(ii) el método de estimación tiene fallas fundamentales: el acto de escoger las localidades sobre las que hay suficientes datos para aplicar el método de Captura-Recaptura y extrapolar de ellas resulta en un sesgo estadístico. Acá consideramos pertinente hacer notar que ésta fue la razón por la que la CVR desestimó esta estrategia en el 2003.

y (iii) cuando comparamos el desempeño de los dos métodos (Rendón y la CVR) usando técnicas de la teoría de decisión estadística, notamos el método de Rendón es consistentemente inferior a la del de la CVR. En nuestra opinión esto explica por qué Rendón obtiene resultados absurdos.

Parte de la evidencia con la que sustentamos los puntos (i) y (iii) proviene de datos publicados posteriormente al trabajo de la CVR. Estos datos provienen del “Censo por la Paz”, un levantamiento de información conducido por el Ministerio de la Mujer y Desarrollo Social del Perú (MIMDES) entre 2003 y 2006, y publicado el 2006 (vea parte de este trabajo aquí y aquí). Un punto clave es que los esfuerzos de recojo de datos anteriores a la CVR prestaron escasa atención a las muertes causadas por Sendero Luminoso. Esta falta de información nos obligó a usar un método indirecto para estimar las muertes producidas for Sendero Luminoso (una explicación algo técnica de este método se puede encontral en la seguna sección de nuestro Suplemento Técnico, aquí). La base de datos el MIMDES aporta una gran cantidad de registros de víctimas de Sendero Luminoso. Esto incrementa dramáticamente nuestras posibilidades de analizar patrones por perpetrador y localidad.

Comparando valores con y sin imputación

Un punto en el que coincidimos con Rendón es en que los registros de víctimas sin atribución de perpetrador no deben ser tratados como pertenecientes a una categoría especial, sino como registros incompletos. La mayor parte de los registros de muertes en las base de datos consignan perpetrador. Los que no lo hacen pueden ser completados usando técnicas de imputación.

En nuestro artículo mostramos la estimación que Rendón produce para el número de muertes atribuídas a Sendero Luminoso sin imputación es menor que el conteo (también sin imputación) del número conocido de muertes, incluyendo MIMDES. Éste es nuestro punto (i). Nos han preguntado si este hallazgo se mantiene usando datos imputados. La respuesta es que sí. La siguiente tabla muestra totales de muertes atribuídas a Sendero Luminoso después de imputar perpetradores desconocidos:

in_2003 in_MIMDES n_SLU_imputed
Yes Yes 4340
Yes No 6294
No Yes 9002
No No ??
Total observed SLU  19636

Rendón estima que Sendero Luminoso causó un total de 18 341 muertes. Este total es mucho menor que el número de registros existentes, 19 636. Nótese una estimación del total debe incluir tanto las muertes conocidas como las aún no registradas y, por lo tanto, debe ser mayor que el número de muertes ya conocidas. Las estimaciones de Rendón son menores que el número de registros existentes y son, por lo tanto, incorrectas.

Los patrones de documentación de muertes en el conflicto armado interno del Perú son complejos, y están afectados por heterogeneidad y dependencia (una explicación de estos fenómenos se puede encontrar aquí). Esto significa que una simple proyección usando captura-recaptura con sólo dos listas sea probablemente inadecuada. El ejercicio puede, sin embargo, ser instructivo. Usando los números de la tabla arriba, el estimador clásico de captura-recaptura de dos sistemas arroja una proyección de 6294 * 9002 / 4340 = 13 055 para la entrada “??” de la tabla.

Usando esta tabla, si la recolección de datos del MIMDES fuera independiente de los esfuerzos anteriores (en un sentido estadístico), esperaríamos que existan alrededor de 13 055 víctimas adicionales a las ya registradas atribuibles a Sendero Luminoso. Esto hace un total de 32 691.

Reitereamos que el estimador de dos sistemas es inadecuado en este contexto. Los procesos de recojo de datos no son estadísticamente independientes, y las víctimas tienen diferentes probabilidades de ser registradas. Sin embargo, el orden de magnitud de este estimado — 32 691 — nos hace creer que el verdadero total de muertes es considerablemente mayor que el número registrado hasta el momento. Esto significa que el total propuesto por Rendón, 18 341, es simplemente demasiado bajo para ser razonable. Es más, esta simple proyección esta muy por encima de su (también irrazonablemente bajo) intervalo de confianza [15,637–21,045].

Como mostramos en nuestro artículo, esta subestimación no es sorprendente. Es la conclusión lógica de un procedimiento técnicamente incorrecto.

Combinación de bases de datos

El argumento que presentamos arriba depende crucialmente de la calidad de los tres números en la tabla. Éstos a su vez dependen de la calidad de nuestra integración de las bases de datos; de si hemos identificando correctamente los registros de víctimas comunes a más de una lista. Nuestro artículo discute este punto explícitamente (notar que los números de los que habla la siguiente cita son sin imputación, no imputados como en la sección anterior; sin embargo las conclusiones son idénticas)

Una nota final acerca de las “regiones imposibles”. Notamos que su validez depende de la calidad de nuestro proceso de combinación de las listas de la CVR y del MIMDES. Duplicaciones sin detectar podrían alterar nuestras conclusiones. Sin embargo consideramos que esto es poco probable. En primer lugar, nuestro proceso de detección de registros duplicados al interior de las bases de datos ha sido agresivo, tanto así detectamos 619 duplicaciones que el propio MIMDES no detectó. Esto significa que nuestros números son conservadores. En segundo lugar, las estimaciones de Rendón para SLU son tan bajas, que para que sean físicamente posibles sería necesario que al menos 6 689 víctimas de Sendero Luminoso aparezcan tanto en la lista de del MIMDES como en los datos del 2003. Esto es el 72% de todos los registros, y 63% más que las duplicaciones que detectamos nosotros (4091). Consideramos que esto es implausible.

Conclusión

Tal como lo hicimos en nuestro post anterior, nos gustaría reiterar que coincidimos con Rendón en que el trabajo de la CVR merece escrutinio científico. Sin embargo, como también expresamos en nuestro artículo:

[…] simplemente notar que el trabajo de la CVR puede ser mejorado no es suficiente para justificar cualquier alternativa. Alternativas deben, como mínimo, tener validez por sí mismas: deben ser estadísticamente correctas, y deben producir resultados plausibles. Adicionalmente, si han de contribuir en algo a la discusión, deben tener alguna ventaja sobre el trabajo original que no sea simplemente parecer más obvias. El trabajo de Rendón falla en estos tres requisitos.

Coincidimos con Rendón en que la magnitud y la distribución por perpetrador de las muertes debidas a la violencia política durante el conflicto armado interno son de gran importancia para la memoria histórica del Perú. Coincidimos también en que estas preguntas ameritan considerable atención científica. Sin embargo, las múltiples fallas del artículo de Rendón (2019) lo hacen completamente inadecuado para esta discusión.

# # #