Advierten que la etapa informática del escrutinio de las elecciones del domingo es "una gran caja negra"

A pocas horas de las elecciones legislativas nacionales del 22 de octubre, el software que se empleará en el proceso de escrutinio de los votos se convirtió en uno de los ejes de la puja entre el Gobierno nacional y el kirchnerismo.

Luego de las PASO del 13 de agosto, cuando Cristina Fernández de Kirchner se impuso por un levísimo margen sobre el macrista Esteban Bullrich, la candidata a senadora nacional por Unidad Ciudadana (UC) en la provincia de Buenos Aires puso en duda en reiteradas ocasiones la transparencia de los comicios porque no hubo respuestas de la Justicia Electoral ante las medidas que exigió su fuerza.

Entre esas medidas reclamadas por la expresidenta se encuentra la auditoría del software empleado en el proceso electoral.

iProfesional entrevistó sobre el tema a Nicolás Wolovick, doctor en ciencias de la computación de la Universidad Nacional de Córdoba.

-¿Qué opinión tiene sobre el software que se utilizará en las elecciones del próximo domingo?-Me gustaría poder opinar, pero no es algo que esté accesible para su inspección y no hablo de código fuente, hablo de todo: binarios, procedimientos, esquemas de contingencia, esquemas de seguridad, etc. Es una gran caja negra. Siempre me pregunto quién auditará este software y los procedimientos asociados.

Cabe aclarar que entiendo que el software al que se refiere es el provisto por la empresa española Indra dentro de sus oficinas en Buenos Aires y que sirve para recibir los telegramas escaneados del Correo Argentino y que un pequeño ejército de personas carguen cada una de las provincias, secciones, circuitos y mesas, unas 97493 mesas.

En realidad me estoy doy cuenta que no conozco varias cosas que serían importantes:

* ¿Los telegramas se escanean con un software de Indra o es algo que el Correo Argentino provee?

* ¿El escaneo está distribuido por secciones o por circuitos?

* ¿Cómo se transmiten los telegramas?

* ¿El sistema de carga de los telegramas es centralizado o se divide por provincias o secciones?

Muchas preguntas para alguien que fue presidente de mesa en las PASO 2017, entiende de tecnología informática y está muy atento a todo el proceso electoral. Creo que esto sólo quiere decir que el procesamiento de los telegramas es realmente opaco.

-¿Está garantizada la transparencia de los comicios legislativos nacionales en cuanto al software que se utilizará en ese proceso electoral?- Este procedimiento es, a los fines prácticos, una caja negra. Conozco gente que se dedica a la seguridad informática, que tiene mucha información de primera mano y que tampoco sabe si alguien audita este software.

Resulta interesante que se podría lograr una gran transparencia en todo este proceso. Por un lado tenemos los telegramas (escrutinio provisorio) y las actas (escrutinio definitivo) que son información pública y por el otro tenemos los datos cargados por los "data-entries" de Indra.

Si el formato de la información fuera un poco más sencillo de leer por una computadora que el que está disponible en la página web que ofrecen aquí, como por ejemplo CSV, JSON o XML, entonces cada uno de nosotros podría hacer un escrutinio en dos pasos.

Por un lado constatando que los telegramas/actas escaneadas estén bien cargadas y por el otro, a partir de todos los archivos con la información de cada mesa, hacer la suma en nuestra propia computadora, con nuestro propio software. ¿Que resulta más transparente que ver que la suma te da lo mismo a vos que a Indra o cualquier proveedor?

Hay que aclarar que revisar que los telegramas estén bien cargados es en principio una actividad que tienen que realizar humanos, pero eso se puede realizar con "crowdsourcing" usando buenas herramientas como las que armó Martín Gaitán aquí para las elecciones legislativas de Octubre de 2013 en Córdoba.

También sería posible automatizar en gran medida esta etapa utilizar visión por computadora para detectar dígitos escritos a mano utilizando las mejores técnicas actuales (ver más aquí). Esto es algo que hace tiempo tengo ganas de hacer.

Otro problema tiene que ver con quién resguarda esta información y cuán pública es. Los telegramas escaneados y los datos cargados del escrutinio provisorio pueden ser fácilmente descargados de aquí. De hecho yo me los bajé y tengo los 9.9 GB de información en mi máquina.

La cantidad de información es abrumadora, pero muy interesante y sobre todo pública. Por ejemplo armé esto para mostrar toda la información que hay:

Para el escrutinio definitivo, es decir de las actas, la situación cambia. Aunque el formato es el mismo, agregar un CAPTCHA para evitar que se baje toda la información de manera automática.

¿Cómo debería ser? Todos los datos abiertos, en formato estándar, de sencilla lectura tanto para humanos (HTML) como para máquinas (CSV), todas las instancias eleccionarias históricas almacenadas en un sitio donde se pueda bajar todo de manera automática.

Fíjese cuál es la situación ahora. Si necesito el escrutinio provisorio de las PASO 2013, tengo que recurrir a alguien que se haya tomado el trabajo de bajarlas de manera completa y que tenga la amabilidad de compartirlas conmigo, pero ¡es información pública! De hecho, ya no están disponibles ni las provisorias de las PASO 2017 y fue hace menos de dos meses.

-¿El software que se utilizará es diferente al utilizado en comicios anteriores? Si así fuera, ¿cuáles fueron esos cambios y cómo afectan al escrutinio del comicio?-Desconozco. Adrián Pérez, el secretario de Asuntos Políticos e Institucionales del Ministerio del Interior, mostró que estaban haciendo un simulacro de carga, pero esa es toda la información que tengo:

<blockquote class="twitter-tweet" data-lang="es"><p lang="es" dir="ltr">[AHORA] Realizamos el simulacro del escrutinio provisorio con la presencia de representantes de los partidos políticos <a href="https://twitter.com/hashtag/Elecciones2017?src=hash&ref_src=twsrc%5Etfw">#Elecciones2017</a> <a href="https://t.co/8xFVrEF7Mv">pic.twitter.com/8xFVrEF7Mv</a></p>— Adrián Pérez (@adrianperezARG) <a href="https://twitter.com/adrianperezARG/status/916662253939757062?ref_src=twsrc%5Etfw">7 de octubre de 2017</a></blockquote>

Creo que para mejorar la transparencia en el proceso de carga, la información debería estar disponible desde el momento 0 y con indicaciones claras de que se va cargando y a qué ritmo.

Toda la cadena de información está, solo habría que hacerla disponible en tiempo real, a medida que va sucediendo. Es una oportunidad perdida, ya que hacer esto es sencillo en términos tecnológicos y aporta una transparencia adicional al proceso, sobre todo de cara a salir a hacer declaraciones a las 10pm.

Probablemente el punto de conflicto esté en la centralidad de la carga de datos. Un esquema alternativo se probó en dos localidades de Santa Fe para las elecciones del 13 de agosto pasado, descentralizando el escaneo y confección de actas por cada mesa.

Eso es un claro ejemplo de cómo se puede aplicar tecnología en el proceso electoral para mejorar la transparencia, la rapidez y la confianza en los resultados sin poner en riesgo ni secreto del voto ni la universalidad en su auditabilidad.

Temas relacionados