Cada día, administraciones, instituciones públicas y empresas de todo el mundo, producen una gran cantidad de información. El Internet de las Cosas (del inglés Internet of Things o IoT) hace que la recopilación de los datos haya aumentado de forma exponencial y cada vez encontramos más casos de empresas privadas y administraciones públicas que las posan a disposición de todo el mundo. Esta es la esencia de la Open Data, o datos abiertos, que consiste a posar la información acumulada a disposición de quien lo quiera.

Tenemos ejemplos de uso de datos abiertos muy cotidianos y de los que quizás no somos conscientes. Servicios de geolocalización como OpenStreet Maps o de previsión del tiempo funcionan gracias a repositorios de datos abiertos. Muchos ayuntamientos y la propia Generalitat de Catalunya disponen de portales de datos abiertos de donde numerosas apps y servicios que utilizamos recogen información para cruzarla y crear productos útiles.

También hay casos exclusivamente empresariales, como el de algunos bancos, que a partir de sus propios datos recopilados, y otros datasets públicos, han creado apps, por ejemplo, para poder valorar el coste de una vivienda. La Fundación COTEC publicó a finales de este 2019 un guía para las empresas, con ejemplos muy interesantes donde se  pueden encontrar los diferentes modelos empresariales que hay en la actualidad basados en el uso de Open Data. Queda claro pues que el potencial de los datos abiertos es enorme, que el cruce y uso de diferentes datasets públicos y privados puede generar fuentes de información y nuevos servicios de gran impacto.

¿Que son los datos abiertos?

Los datos abiertos cumplen unas características concretas: están en formato digital, estandarizadas, son reutilizables y redistribuibles de manera libre (disponen de una licencia de uso que  permite su utilización y sin ninguna restricción).

Hablamos que son reutilizables, porque consideramos este dato como un formato estructurado, o sea, los datos se pueden crear y manipular para cualquier software, libres de restricciones legales. En el mismo proceso que se preparan los datos porque sean estructurados, también pasan un proceso de anonimización para garantizar que no se podrá ni identificar ni exponer ninguna persona, o sea, se garantiza la privacidad de todas las personas.

Los datos se pueden utilizar cuando se publican en formato común y comprensible, esto quiere decir que no simplemente se tienen que publicar de forma que se puedan utilizar, sino que se tiene que procurar que estos datos tengan la mayor calidad posible.

Su calidad la podemos medir en el cumplimiento de cuatro recomendaciones: fácil de encontrar, accesible, interoperable y reutilizable (en inglés se utiliza el acrónimo FAIR, Findable, Accesible, Interoperable and Reusable). El inventor de la web, Tim Berners-Lee propone un esquema de cinco estrellas para clasificar rápidamente la calidad de los datos.

Esquema de 5  estrellas de Datos Abiertos creada por Tim Berners-Lee

 

 

Por tanto, si miramos con detalle la escala que nos propone este esquema, vemos que cuanto más abierta sea la licencia del fichero, más estructurada e interoperable sea el dato, o el formato sea legible por el máximo de sistemas, más calidad tendrá. Por ejemplo, un PDF aunque sea un formato común es un formato más restrictivo que un fichero csv, que puede leer cualquier programa.

El mundo crece con los datos

Es evidente que no somos conscientes de la cantidad de datos abiertos que existen a nuestra disposición y que son reutilizables. Para haceros una idea, os proponemos que visitéis unos cuántos datasets, como el portal de datos abiertos de la Generalitat, el Servicio de datos abiertos del Ayuntamiento de Barcelona o el de Tarragona, sin olvidar las iniciativas pioneras como el del ayuntamiento de Gavà como ejemplos paradigmáticos. También hay iniciativas interesantes de carácter más pequeño, como las generadas por asociaciones, que ofrecen una gran diversidad de datos. Como ejemplo citaremos el Banco de datos de biodiversidad de Cataluña.

DataSet de ejemplo

El pasado 18 de noviembre, al m4social day hablamos con diferentes personas del ámbito de la administración pública, como desde la pericia del uso de los datos, porque nos dieran respuestas sobre como los datos sociales podían interoperar. Podéis ver el resultado a través de estas entrevistas.

 

Tercer Sector y Open Data

Existen datasets abiertos propios del Tercer Sector? ¿Cuáles son los más utilizados por las entidades? Son dos de las grandes preguntas que os invitamos que nos ayudáis a resolver. Actualmente hay muy poca información relativa a la atención social por parte de las entidades, disponible de forma abierta.

El uso de datos abiertos y su producción es una pieza más del trabajo basado en datos. Durante el 2019 m4Social ha trabajado este aspecto desde diferentes perspectivas: protección de datos, interoperabilidad, toma de decisiones basadas en datos, etc. Los datos abiertos aportan una nueva manera de trabajar, un planteamiento donde la cultura de compartir se pone en valor y donde se busca maximizar el impacto que se puede generar a partir de los datos que obtenemos.

“Normalmente nos encontramos que el problema más grande es la falta de cultura de datos”, nos explicaba Eric Hannell de DataForGood en una entrevista reciente hecha por m4social. Esta entidad barcelonesa ofrece apoyo a las entidades del Tercer Sector que quieren trabajar con datos y no saben por donde empezar. Aunque haya dificultades del principio os podéis encontrar que el mismo Eric también nos anima: “nosotros siempre decimos a la gente: inténtalo, porque quizás te sorprenderás del que es posible“.

Fotografia de Tobias Fischer