PROBLEMA
     
  Las políticas de apertura de datos por parte de los ayuntamientos no está siguiendo, por lo general, un diseño centrado en la ciudadanía. Así, el diseño de los portales de datos y la selección de datasets publicados se realiza sin apenas interacción con ciudadanas o ciudadanos. Este hecho limita la adecuación de los datos abiertos y su capacidad para convertir la información pública en un recurso cívico a disposición de la ciudadanía.  
     
NUESTRA PROPUESTA DE SOLUCIÓN
     
  Es necesario que los ayuntamientos activen procesos de escucha activa para conocer de primera mano los intereses de sus ciudadanas y ciudadanos. Como se expresa en la sección “Open data: agent of change” del Portal Europeo de Datos, a través de la Gerente de Desarrollo Internacional (Liz Carolan), 'debemos hacer un cambio de chip, no debemos enfocarnos tanto en la oferta, sino observar lo que demanda la gente y ofrecer los datos como una herramienta para ayudar a crear soluciones'.  
     
CÓMO PODEMOS HACERLO
     
 

Actualmente, una de los espacios social media donde la ciudadanía se encuentra, conversa y expresa sus intereses es Twitter. Nuestra propuesta pasa por monitorizar ahí la conversación, analizarla y clasificarla siguiendo el mismo sistema de categorías estandarizado que se emplea en la catalogación de los datos abiertos publicados en los portales de datos abiertos y, de esta forma, tener dos datos comparables.

Por un lado, tendremos todos los datasets organizados por categorías y, por otro, todos los tweets clasificados en esas mismas categorías. Así, será posible calcular los pesos de los datasets y el peso del volumen de la conversación. Con ello, se podrán evidenciar las diferencias y similitudes entre los temas manifestados por la ciudadanía y los datasets publicados.

Para alcanzar estos objetivos nuestra propuesta pasa por abordar la solución a través de un sistema automático de clasificación de tweets mediante machine learning. A su vez, con el fin de realizar una solución escalable y fácilmente mantenible se ha realizado un diseño modular:

Módulo 1. Clasificación.
Comprende los siguientes procesos:
* Descarga.
* Lectura RDF.
* Entrenamiento.
* Clasificación.


Módulo 2. Reportes.
Comprende los siguientes procesos:
* Desarrollo API.
* Visualización.

La implementación de la solución ha seguido los procesos del método clásico de desarrollo en cascada (análisis, diseño, implementación y pruebas).

 
     
CASO DE ESTUDIO
     
  El sistema ha sido desarrollado y testado considerando como caso de estudio el Ayuntamiento de València.  
     
LICENCIA
     
  La solución planteada está pensada para ser utilizada por cualquier ayuntamiento o institución que lo desee. Para ello, tanto el código como la documentación se encuentran disponibles en el repositorio de GitHub y se encuentran publicadas bajo licencia Creative Commons Attribution-ShareAlike 4.0 International License..