|
Actualmente, una de los espacios social media donde la ciudadanía se encuentra, conversa y expresa sus intereses es Twitter. Nuestra propuesta pasa por monitorizar ahí la conversación, analizarla y clasificarla siguiendo el mismo sistema de categorías estandarizado que se emplea en la catalogación de los datos abiertos publicados en los portales de datos abiertos y, de esta forma, tener dos datos comparables.
Por un lado, tendremos todos los datasets organizados por categorías y, por otro, todos los tweets clasificados en esas mismas categorías. Así, será posible calcular los pesos de los datasets y el peso del volumen de la conversación. Con ello, se podrán evidenciar las diferencias y similitudes entre los temas manifestados por la ciudadanía y los datasets publicados.
Para alcanzar estos objetivos nuestra propuesta pasa por abordar la solución a través de un sistema automático de clasificación de tweets mediante machine learning. A su vez, con el fin de realizar una solución escalable y fácilmente mantenible se ha realizado un diseño modular:
Módulo 1. Clasificación.
Comprende los siguientes procesos:
* Descarga.
* Lectura RDF.
* Entrenamiento.
* Clasificación.
Módulo 2. Reportes.
Comprende los siguientes procesos:
* Desarrollo API.
* Visualización.
La implementación de la solución ha seguido los procesos del método clásico de desarrollo en cascada (análisis, diseño, implementación y pruebas).
|
|