28 de junio de 2020

,

UN DATA SET PARA LIBERAR (un poquito) AL SICOES



  Uno de los principales problemas a la hora de gestionar políticas públicas, es la transparencia. Existe una creencia muy arraigada de que mientras más obscura sea un gestión pública, esta tiende más hacia la corrupción. Para evitar esto se tiende a aplicar modos transparentes de contratación y adquisición de servicios y bienes por parte del Estado.


Dentro de este sistema de creencias políticas y pautas de conducta, se ha creado el portal SICOES (https://www.sicoes.gob.bo/), como un sitio donde se agrupan, visibilicen y sobre todo se fiscaliza en qué gasta el gobierno el dinero del pueblo boliviano. Esta plataforma no es el único sistema con estas características en el mundo, existen algunos con mayores niveles de transparencia y otros con menores. Entre los primeros podemos poner como ejemplo al sistema colombiano de contrataciones y entre los últimos el opaco sistema venezolano de adquisiciones estatales, en cambio Bolivia el SICOES parece que ha optado por un estrategia de limiatr el acceso a la información mediante pequeños ardid tecnológicos, que con un poco de esfuerzo pueden ser superados.


Estás triquiñuelas impiden un libre y democrático acceso a la información. No es menester señalar que el SICOES oculta la información, sólo que no la visibilizan con mayor facilidad, en un momento en el que las posibilidades tecnológicas permiten incluso generar sistemas de alimentado de información automática. 


El presente texto trata de explicar cómo se obtuvo la información de las tablas iniciales del SICOES, las mismas que contienen datos como el número de contrato, la entidad, el tipo de contratación y otros, quizas información insuficiente, pero en una cantidad de más de 6000 registros, detallados en un Dataset público y de libre acceso, para que dirigentes vecinales, periodistas, público interesado, puedan analizar esa información y verificar qué contrataciones ha hecho su municipio, su gobierno departamental o algún ministerio o entidad pública descentralizada.


También mostramos el método en el que se obtuvo la información y se alienta a que el público pueda alimentar este Dataset con más datos, con más registros. Por ahora tenemos más de 6000, pero quisiéramos 10000 o 30000, ya que cuando se masifican los registros las visualizaciones de datos se hacen muy interesantes y se encuentran anormalidades. Como por ejemplo, que en plena crisis causada por el SARS-CoV-2, el Gobierno Autónomo Departamental del Beni gastó casi 40,000 Bolivianos en indumentaria deportiva para sus selecciones de fútbol. Prioridades son prioridades y parece que para algunos las canchas son primero que los hospitales.

Y cual es el problema con el SICOES?



La construcción de un gobierno honesto y transparente generador de resultados visibles y medibles es un compromiso que el Estado boliviano asumió parte de un largo proceso de lucha contra la corrupción y la impunidad en la administración pública. En ese sentido se trató de establecer sistemas de fiscalización y control en algunos casos aplicando las disposiciones jurídicas existentes y en otros casos creando nuevos sistemas y normativas todo para tratar de buscar una transparencia en la gestión pública una cultura de anticorrupción entre los funcionarios y la sociedad (1).


La ley anti corrupción en Bolivia (2), pero sobre todo el NB-SABS[1] posibilitan la creación de un portal, el SICOES, construido en el Frontend (3) con tecnología jQuery (4), que no era parte de la tendencias tecnológicas del momento:
  • Datos estructurados
  • Web a Tiempo Real
  • Personalización
  • Web Móvil
  • Realidad Aumentada (5)


¿Era en el momento la mejor decisión? Quizás sí, pero con ciertas limitantes, sobre todo no permitir algo que se puso de moda entre el 2010 y más recientemente con el boon del data science (6) que es alimentar bases de datos masivas, por ello ¿Es el SICOES un lugar óptimo y eficiente para ser la plataforma de control del gasto público? Y ¿Como está construido el SICOES en el momento, es útil para que los periodistas, por ejemplo, hagan una análisis de datos y control del gasto público?

Qué es lo que quiero?



Determinar el grado de facilidad de obtención de datos de la plataforma https://www.sicoes.gob.bo/ para realizar un control de gasto, tomando solo como primera referencia la página web y la tabla que muestra el sitio.

 


Captura de Pantalla del sitio https://www.sicoes.gob.bo/ en fecha 20/06/2020

Además

  • Especificar una escala de facilidad de obtención de datos de una plataforma.
  • Evaluar la facilidad de obtención de datos de la plataforma https://www.sicoes.gob.bo/ 
  • Detallar el procedimiento de obtención de datos de la plataforma https://www.sicoes.gob.bo/ 
  • Generar un Dataset que cumpla requisitos de datos abiertos, para lograr visualizar las cantidades de contratos por entidades y el sector de salud.
  • A partir del Dataset visualizar los datos en una plataforma que permita una visualización sin restricciones de acceso.
  • Liberar el Dataset y las herramientas de obtención de datos para que la experiencia se replique y mejore con el tiempo.

Qué significa fácil y que tan fácil es obtener datos del SICOES



Para determinar esta es necesario hacer una escala de “facilidad”, que arbitrariamente será del 1 al 5, donde 1 es la mas facil y 5 la más complicada.

Nivel
Especificaciones
1
Un sitio que estructura sus datos y los brinda al usuario a través de una API (7)
2
Sitios que brindan datos de forma estructurada directamente (8). Es decir que permiten descargar la información en formatos abiertos (ods, csv o similares) para que puedan ser leídos tanto por humanos como por máquinas (9).
3
Sitios que brindan datos de forma estructurada o Datos semiestructurados (10)  como por ejemplo https://www.contratos.gov.co/consultas/inicioConsulta.do que a travez de un sistema de busqueda, brinda la informacion basica de un proceso de contratacion en formato HTML, que pude ser trasladado a un dataset con herramientas de programacion.
4
Sitios que obstaculizan el acceso a la información. Por ejemplo aquellos que no tiene un exportador de información a un formato de lectura de datos abiertos (o siquiera en “.xlsx”). Los formularios donde se resumen el proceso en cuanto a datos más valiosos (costos, tiempo de ejecución, especificaciones técnicas) se presentan en datos no estructurados o incluso en PDF que son mapas de bits (imagenes).
5
Sitios que ocultan o borran la información, como el sistema de contrataciones venezolano (11)
Fuente: Elaboración propia

Aplicando la la escala precedente, se puede inferir que el SICOES tiene un nivel 4 de acceso a la información. Por ejemplo, si se trata de guardar la página web que muestra las contrataciones (como la captura de pantalla ya mostrada) el resultado es una serie de datos semi estructurados que pueden ser difíciles de trasladar a un dataset.


Ejemplo del código HTML de una página del sicoes. nótese que es un formato poco legible.


Algo que se agrava cuando no se puede descargar por lotes[2] las páginas de resultados consultados. Por ejemplo, cuando tratamos de ver todas las contrataciones del Gobierno Departamental de Beni desde 2018 al presente no se puede generar una descarga por lotes de las 338 páginas, ya que la plataforma obliga al usuario a pasar de una página a la siguiente de forma manual.


 
Nótese que cuando el cursor elige la página deseada muestra un objeto javascript. Captura de pantalla de la página del SICOES el dia 20/06/2020.

Y cómo obtenemos los datos



Ya que el SICOES es difícil de acceder, no queda de otra que construir herramientas que permitan acceder a los datos de otra forma. En este caso una vez obtenido los resultados de las consultas, se accede a la consola de inspección de elemento del navegador (en este caso Mozilla Firefox), se identifica la etiqueta Table que contiene los datos y se la copia, para luego pegarla en un editor de codigo, y asi sucesivamente con cada pagina[3], hasta obtener la información necesaria.


Se generó un macros para automatizar la operación, (que lastimosamente no puede exportarse para poder ser replicado) que logró obtener 6505 registros únicos, que están liberados en un dataset en la siguiente dirección https://bit.ly/3hNdxbn, pero tambien puden hacer el proceso de forma manual, solo que en aproximadamente 4 a 6 horas de trabajo continuo. En un video esta el procedimiento.




El dataset incluye la información recolectada con el procedimiento indicado anteriormente, además de datos segmentados del sistema de salud boliviano (seguros, hospitales e institutos) y ministerios, entre el 28 de enero de 2020 al 18 de junio de 2020. También incluye un diccionario de términos usados en el dataset.

Y qué hacemos con esos datos



Con más de 6000 registros las posibilidades se incrementan, y para solo una muestra se procedió a visualizar la información de contrataciones del sector de salud y de los ministerios, con el siguiente resultado:
 
Fuente: Realizacion propia en base a los datos de https://bit.ly/3hNdxbn



EL gráfico muestra la cantidad de contracciones por el sector salud en relación al tiempo, entre la primera semana de marzo y la primera semana de junio. Lo interesante es que el incremento mayor se realiza en las últimas semanas de junio.


 



Fuente: Realizacion propia en base a los datos de https://bit.ly/3hNdxbn


Nótese que existe una mayor cantidad de contratos del ministerio de comunicación, con relación al de Salud, algo que una periodista investigadora, que se centre en ese caso, aprovecharía para redactar un interesante artículo.


El gráfico muestra los tipos de contratos realizados por los ministerios y sus programas o empresas dependientes. Los dashboard se encuentran accesibles en https://bit.ly/2BnqmIP y https://bit.ly/2zOBaz2 

Un breve análisis

El portal del SICOES es un buen intento de lograr transparentar la información sobre los gastos del gobierno, y trata de cumplir las ideas básicas de un gobierno abierto.
 
 Fuente: Osvaldo R. Salazar S http://www.salazarysanchez.com/entradas/2015-07-11-traduccion-infografia-gobierno-abierto.html


Unas de las funciones de del SICOES es permitir que el Gobierno Boliviano cumpla con su objetivo de tener una política de Gobierno Electrónico, orientado a la transparencia y eficiencia como está resumido en varias de las actas del Consejo para las Tecnologías de Información y Comunicación del Estado Plurinacional de Bolivia (12), procurando brindar información de la siguiente manera.
  • Abierta por defecto
  • Oportuna y completa
  • Accesible y utilizable
  • Comparable e interoperable
  • Para la mejora de la gobernanza y la participación ciudadana
  • Para el desarrollo Inclusivo e Innovación
Entonces, analizando la información obtenida, analicemos si cumple con estos principios.

Principio
Nivel de cumplimiento
Abierta por defecto
Presenta datos semiestructurados y no estructurados con ciertas restricciones.
CUMPLE A MEDIAS
Oportuna y completa
Se publica de forma oportuna (si es que la norma lo exige, por ejemplo es diferente en el caso de contrataciones para las FFAA y la Policía Nacional (13).
CUMPLE
Accesible y utilizable
Se puede descargar los formularios, pero no de forma masiva para analizarlos de forma masiva.
CUMPLE A MEDIAS
Comparable e interoperable
Es interoperable entre entidades de gobierno, pero no con plataformas ciudadanas.
NO CUMPLE
Para la mejora de la gobernanza y la participación ciudadana
Como está presentada su aporte a la mejora de la gobernanza es imperceptible.
NO CUMPLE
Para el desarrollo Inclusivo e Innovación
No fomenta la inclusión ni la innovación.
NO CUMPLE



Si bien, falla del SICOES al facilitar la visualización de la información, complicando su acceso, mostrando datos semiestructurados o en el peor de los casos datos no estructurados, la información está presente y tan solo es cuestion de más trabajo en su obtención, lo que inclumple el presepto de accecibilidad.



El video al que se hace referencia (https://www.youtube.com/watch?v=5cstvQiHRp8), es una muestra de que para obtener una mayor cantidad de datos de esta página se requiere de habilidades técnicas que no son comunes en la población en general, y esa es la población a la que se dirige este trabajo; periodistas, activistas, dirigentes vecinales, que con mínimas capacidades en el manejo de dataset (hojas de cálculo) puede inferir cosas, como, que el Gobierno Autónomo Departamental Del Beni en el periodo 11/2/2020 y el 17/6/2020, realizaron 31 procesos de contratación, de los cuales destacan los procesos:

CUCE
Objeto de Contratación:
Fecha Publicación:
20-0908-00-1045302-0-E
Adquisición De Uniformes De Competencia Titular Y Alterno, Para Las Selecciones Del Beni Que Participaran De La Copa Integración Nacional De Fútbol Sub 18 Damas Y Varones-
17/6/2020
20-0908-00-1045248-0-E
Adquisición De Zapatillas De Fútbol, Para Las Selecciones Del Beni Que Participaran En La Copa Integración Nacional De Fútbol Sub 18 Damas Y Varones-
17/6/2020
Fuente: realización propia con datos de SICOES[4]
Visualizando los datos del codigo 0908 (Gobierno Autónomo Departamental Del Beni) se obtiene el siguiente gráfico.

 
fuente: Realización propia con datos del SICOES


Es entonces que con el dataset liberado, y en un simple vistazo, las personas interesadas puedan ver en qué gastaron los gobernantes durante un periodo de crisis de salud pública, e identificar cosas como la siguiente:

 
Cantidad de contrataciones acumuladas del sistema de salud boliviano. fuente: Realización propia con datos del SICOES


El gráfico muestra en una línea de tiempo la cantidad de contratos (sin distinguir tipologías) que realizaron el conjunto de instituciones de salud en el país. Se puede observar dos cosas, que existe un repunte entre el 25 de mayo al 12 de junio, pero al otro extremo hay una caída de contrataciones entre el 15 de marzo y el 24 de abril de 2020 (con un promedio de 3 contrataciones diarias), tomando en cuenta que el Gobierno dictaminó cuarentena el 21 de marzo (14). Entonces uno podría suponer que en vista de la crisis, el sistema de salud incrementa sus procesos de contrataciones, sobre todo de personal calificado e insumos y  de forma radical a partir de la última semana de marzo, pero NO.


Ahora, el alcance del presente texto no analiza los contratos, sus montos o el destino de las adquisiciones, sino que tan solo pretende cumplir con uno de sus objetivos, el liberar una dataset para que la población cuestione el cómo el gobierno gestiona una crisis de salud.

Conclusiones



Creo que logramos demostrar que él SICOES es un portal en el cual se puede acceder a la información de las contrataciones, pero su forma de acceso es compleja y en algunos casos insuficiente, o peor aún, mostrando datos no estructurados, imposibilitando un acceso a esta información de forma escalable.


Pero si uno tiene ciertas capacidades técnicas puede darle una vuelta a la situación y eso rompe uno de los principios, ya que crea sesgos de discriminación. Se supone que la información que brinda el gobierno debe ser accesible para la mayor cantidad posible de personas y dudo seriamente que una alta mayoría de la población boliviana tenga conocimientos básicos en edición de código html. Por lo tanto la información que presenta el SICOES no cumple con las características de gobierno abierto, que es presentar los datos de forma democrática y simple.


En cuanto a la capacidad de tener información y plasmarla un dataset es interesante, las posibilidades que esté brinda al usuario final son muchas, ya que este puede hacer las interpretaciones que quiera a partir de los datos presentados y liberados. Por ejemplo un periodista puede hacer un artículo sobre los gastos del municipio de Nuestra Señora de La Paz que ha realizado en la adquisición de insumos médicos, contrastandola con relación a la cantidad de infectados por SARS COV-2. Con un dataset aún más amplio, de 10000 o 30000 registros, las posibilidades son casi infinitas.


Bibliografía



ANEXOS

Lista de links
Detalle
Link corto
Link completo
Dataset
https://bit.ly/3hNdxbn
Video tutorial de como obtener la tabla de datos de la página del SICOES

Cantidad de contratos por ministerio.
https://bit.ly/2BnqmIP
Contrataciones del sistema de Salud Boliviano (Seguros, hospitales e institutos)
https://bit.ly/2zOBaz2

Archivos que se incluyen en la carpeta compartida


Para mayor accesibilidad se comparte en una carpeta en Google Drive los archivos que se usaron para el presente texto. Pueden ser descargados, editados y modificados. Ver información sobre la licencia de distribución.
Nombre del Archivo
Descripción
allhtml.txt
Código HTML obtenido de la página del SICOES del proceso de copiar y pegar.
SICOES_html_dataset.html
Codigo ya depurado y con formato en un archivo HTML obtenido partir del archivo allhtml.txt y beni.txt 
El formato se generó con el plugin (extensión) Prettier de Visual Studio Code. Para mayor detalle ver el video https://www.youtube.com/watch?v=5cstvQiHRp8
beni.txt
Código HTML obtenido de la página del SICOES del proceso de copiar y pegar. Generado en el video https://www.youtube.com/watch?v=5cstvQiHRp8
beni.html
Codigo ya depurado y con formato en un archivo HTML obtenido partir del archivo beni.txt 
El formato se generó con el plugin (extensión) Prettier de Visual Studio Code. Para mayor detalle ver el video https://www.youtube.com/watch?v=5cstvQiHRp8
SICOES_html_dataset_od_op
Dataset generado a partir del archivo SICOES_html_dataset.html que está liberado en el link https://bit.ly/3hNdxbn 
Trabajo_DDA_NestorAraujoMamani
El presente documento

Detalles de la licencia de los archivos.

https://creativecommons.org/licenses/by-sa/4.0 


Mayor información: https://creativecommons.org/licenses/by-sa/4.0



[1] NORMAS BÁSICAS DEL SISTEMA DE ADMINISTRACIÓN DE BIENES Y SERVICIOS NB-SABS, Decreto Supremo N° 0181 de 28 de junio de 2009
[2] Grandes cantidades de páginas web por medio de programas especializados.
[3] Para mayor detalle pude ver el siguiente video https://www.youtube.com/watch?v=5cstvQiHRp8 
[4] No es momento este para discutir si en plena pandemia de SARS-CoV-2, el GADBN destina más de 21.600 Bs para comprar indumentaria deportiva, cuando se han suspendido y posiblemente cancelado competencias nacionales de fútbol.