¿Fraude electoral… o no?
¿Qué tipos de herramientas se pueden usar para descubrir manipulaciones en los números?
La que sigue es una historia verdadera. Pasó hace unos años, más precisamente durante 2009, durante las elecciones presidenciales en Irán. Quiero presentar un trabajo público que hicieron dos matemáticos norteamericanos: Bernd Beber y Alexandra Scacco (1). Este trabajo se basa en los resultados públicos que ofrecieron las autoridades iraníes. Después de leer la versión abreviada de lo que ellos escribieron, estoy –casi– seguro de que usted (como me pasó a mí) tenderá a sacar conclusiones definitivas. Es muy tentador hacerlo porque los datos, justamente, apuntan en la dirección de que hubo fraude. La prensa occidental se ocupó de sugerirlo de todas las maneras posibles y créame: yo no lo sé ni tengo una opinión formada al respecto. Es por eso que le sugería que sea cuidadosa/o antes de formarse una opinión definitiva. En todo caso, mi objetivo al proponer esta nota es que sepamos qué tipos de herramientas matemáticas se pueden usar para descubrir o detectar potenciales manipulaciones en los números. No son definitivas, porque no constituyen una prueba, pero son indicadoras de que algo podría haber pasado.
Empiezo por poner las cosas en contexto. Las elecciones se llevaron a cabo el 12 de junio del 2009. Había cuatro aspirantes a la presidencia: Mahmoud Ahmadinejad, Mid Houssein Mousavi, Mehdi Karroubi y Mohsen Rezai. Sé que los nombres nos dicen poco a nosotros, los que vivimos en esta parte del mundo, pero yo creo que corresponde conocer de qué personas estamos hablando. En el momento de las elecciones, Ahmadinejad ya era Presidente y aspiraba a la reelección.
El contexto del que hablaba indica que había una fuerte sospecha de que podría haber fraude. De hecho, en el momento en que se conocieron los resultados que exhibían una abultada victoria de Ahmadinejad, aparecía como muy sorpresivo que hubiera ganado en áreas urbanas, incluida la capital Teherán, e incluso en Tabriz, la ciudad natal de uno de los candidatos, Mir Houssein Mousavi. Otros apuntaron a la pobre performance de Mehdi Karroubi, incluso en Lorestan, su provincia natal.
De todas formas, lo que más llamó la atención es que no sólo en una elección que debía ser muy disputada, en el mejor de los casos, para el oficialismo, quien era Presidente recibió más del 71 por ciento de los votos. Pero todo esto, que se puede leer en el artículo que al efecto publicó el 20 de junio del 2009 The Washington Post (2), firmado por Beber y Scacco, los autores del trabajo científico, son conjeturas, sospechas que, naturalmente, están teñidas del color político con el que uno lo mira. Pero la matemática puede hacer otros aportes y de eso quiero hablar acá.
El primer dato que llama la atención es que la distribución de los votos del ganador fue muy uniforme, es decir, ganó virtualmente por el mismo porcentaje en todas las provincias. Esto, en sí mismo no tendría por qué sorprender, salvo que uno mire la historia de las elecciones en Irán y descubrirá que eso no había pasado nunca. Siempre hubo disparidad manifiesta entre los candidatos presidenciales que representaron a los distintos partidos, y las fluctuaciones eran evidentes en función de la geografía: en zonas urbanas ganaban unos, en zonas rurales ganaban otros, las diferencias eran muy ostensibles.
Sin embargo, ese dato aislado no dejaría de ser una curiosidad y nada más. Pero Scacco y Beber decidieron hacer otra cosa. Los humanos tenemos un problema muy serio con el azar. Por ejemplo, si yo le pidiera que usted fuera diciendo números al azar, es posible que los primeros de su lista lo sean, pero si usted tuviera que seguir y seguir hasta llegar al millón de números o más, inexorablemente aparecen patrones que ni usted mismo sospecha. Una computadora puede hacerlo instantáneamente.
Un hecho curioso surgió una vez con los iPod que fabrica Apple. Una de las funciones es la que se conoce como “random” (“al azar”, en castellano). Esa función es a la que uno apela si tiene una base de canciones muy grande y quiere que sea el propio aparato el que le haga una selección aleatoria. El problema se generó porque muchos usuarios decían, por ejemplo, que “la función ‘random’ me funciona mal, aparecen muchas canciones seguidas del mismo álbum”, algo así como si uno empezara a tirar una moneda al aire y saliera siete veces consecutivas cara o ceca. Lo más probable (y esto lo compruebo personalmente en forma sistemática), las personas que ven esos resultados sospechan inmediatamente que hay algo “raro” en la moneda o vos estás haciendo algo que yo no me doy cuenta. Sin embargo, la probabilidad de que eso suceda es mucho más alta de lo que uno presume, y por lo tanto, nuestra capacidad para entender lo que es el “azar” está siempre puesta en duda.
¿Por qué escribí esto sobre el azar? Téngame paciencia y verá. Necesito dar un último paso. Suponga que yo le pidiera que usted escriba una lista con mil números naturales, o diez mil, veinte mil, no importa... una lista con muchos números. Ahora, fíjese en el último dígito de cada uno de ellos; fíjese que dije el último dígito, no el primero. Por ejemplo, si usted escribió el número 1479384, me estoy refiriendo al número cuatro. Dicho esto, pregunta: si la lista que usted escribió es al azar, ¿cuál tendría que ser el porcentaje de ceros, unos, dos, tres, cuatros, cincos, seis, sietes, ochos y nueves que aparecen como último dígito de cada número de su lista?
Sin pensar demasiado, si los números que usted eligió fueron al azar, no hay ninguna razón para que cada uno de los dígitos aparezca con mayor frecuencia que otro. Es decir, la distribución debería dar un 10 por ciento (aproximadamente, claro está) por dígito. Lo mismo debería suceder con los resultados en cualquier votación: el último dígito, o los dos últimos dígitos (los que no definen ninguna elección) deberían aparecer con la misma frecuencia, un 10 por ciento cada uno en el caso del último, y un uno por ciento en el caso de los dos últimos.
Como decía más arriba, cuando uno tiene que representar al azar o replicarlo... aparecen muchos problemas: no somos muy buenos al hacerlo. Si alguien quiere manipular números, debería tener en cuenta ese hecho. En general, nos parece que el número 3 o el número 7 representa más el azar que el número 0 o el número 5. Ahora vuelvo al caso Irán.
Beber y Scacco escribieron: “Vamos a concentrarnos en el número de votos que recibió cada candidato en cada una de las diferentes provincias, en particular en el último y penúltimo dígito. Por ejemplo, si un candidato recibió 14.579 votos en una provincia (como fue el caso de Karroubi en la provincia de Isfahan), vamos a focalizar nuestra atención en los números 7 y 9. Parecerá extraño porque estos dígitos, usualmente, no cambian quién es el ganador. De hecho, los últimos dígitos en una elección honesta no nos dicen nada de los candidatos, ni la composición del electorado ni el contexto de la elección. Son parte del ‘ruido’ del azar, en el sentido de que una recolección de votos cualquiera podría terminar tanto en 1 como en 2, 3, 4... o cualquier otro dígito. En algún sentido este dato sirve como ‘prueba de fuego’ (3) para decidir si hubo fraude o no. Por ejemplo, una elección en donde el número de votos termina mayoritariamente en 5, debería llamar la atención”.
Siguieron un poco más adelante: “Revisamos los datos que proporcionó el ministerio del Interior y que fueron publicados por la página web oficial Press TV. En total se contabilizaron 29 provincias y revisamos los totales de los cuatro candidatos: 116 números. Justamente estos números nos parecieron sospechosos. Encontramos demasiados números 7 y no suficientes 5 como último dígito. Esperábamos que cada dígito apareciera al final con una frecuencia del 10 por ciento. Sin embargo, en los resultados por provincia, el número 7 aparecía el 17 por ciento de las veces y solamente el 4 por ciento eran números 5”.
Por último, algo más respecto de la especie a la cual pertenecemos usted y yo, los humanos: nos resulta muy complicado escribir números al azar que terminen en dos dígitos que no sean consecutivos. Es decir, nos es más fácil escribir un número que termine en 23 que en 64 o en 17. Si los datos no hubieran sido manipulados, uno esperaría que el 70 por ciento de esos números consistiera de pares de dígitos distintos no consecutivos. En el caso de las elecciones presidenciales en Irán, solamente 62 por ciento de esos pares fueron no adyacentes. No parece una diferencia muy grande pero si uno calcula la probabilidad de que esto suceda en una elección honesta, ese número es apenas superior al 4 por ciento.
Un párrafo final. Un artículo publicado el 22 de julio del 2014 por Walter Mebane, Naoki Egame, Joseph Klaver y Jonathan Wall (4), pone en duda el trabajo de Scacco y Beber. No lo hacen en forma directa, pero sí cuestionan las observaciones hechas por papers de este tipo. A todos aquellos interesados en el tema, les sugiero que busquen la literatura que es muy abundante y también controversial.
Es por eso que yo no voy a sacar ninguna conclusión ni, como dije más arriba, tengo posibilidades de ofrecer una opinión educada. Pero lo que sí puedo hacer, y de hecho estoy haciendo, es advertir sobre los métodos que están a disposición de todas las personas honestas que quieren/queremos que haya elecciones honestas y no fraudulentas en todas partes del mundo.
(1) “What the Numbers Say: A Digit-Based Test for Election Fraud” (“Lo que dicen los números; un test basado en el estudio de los dígitos para (detectar) fraude en una elección”), por Bernd Beber y Alexandra Scacco, Political Analysis 20(2): 211-234
(2) http://www.washingtonpost.com/wp-dyn/content/article/2009/06/20/AR2009062000004.html
(3) Los autores usaron la frase “litmus test”, que se usa en química para decidir sobre la alcalinidad de una sustancia. En este caso, me pareció que la mejor traducción era “prueba de fuego” pero, por supuesto, es mi traducción libre.
(4) http://spia.uga.edu/polmeth/library/ pm14.pdf
--------------------------------
Para suscribirte con $ 1000/mes al Cohete hace click aquí
Para suscribirte con $ 2500/mes al Cohete hace click aquí
Para suscribirte con $ 5000/mes al Cohete hace click aquí