m4social i DataForGoodBCN iniciem una col·laboració amb l'objectiu de facilitar a les entitats del tercer sector social el treball en el món de les dades.  DataForGoodBCN és una associació sense ànim de lucre que promou l’ús de dades en entitats que treballen per un impacte positiu a Barcelona. Principalment ho fa mitjançant voluntariat i assessorament en projectes relacionats amb dades.

Una de les característiques que comparteixen totes les persones de la nostra societat actual és que generen dades constantment. Produïm dades de posició i comportament només pel fet de portar el telèfon a la butxaca, dur posada una polsera esportiva o fer servir l’ordinador portàtil. Fins i tot qui no utilitza activament la tecnologia genera dades cada vegada que utilitza el transport públic, fa compres en un supermercat, entra al gimnàs…

Totes aquestes dades han esdevingut un valor clau per la competitivitat de les empreses. Una mostra d’això són els 19.000 milions de dòlars que l’any 2014 Facebook va pagar per WhatsApp, un servei gratuït sense publicitat. En aquest cas, els algoritmes que utilitza la xarxa social per mostrar publicitat van passar a alimentar-se amb les converses de WhatsApp, de la mateixa manera que els algoritmes de Google es nodreixen dels correus electrònics que intercanvien les persones que utilitzen Gmail.

Les dades com a valor social

L’impacte que pot tenir l’explotació de les dades no ha passat desapercebut per ningú. Afortunadament, moltes iniciatives socials també han contemplat aquest potencial i, en l’actualitat, s’estan duent a terme una gran quantitat d’iniciatives relacionades amb les dades amb objectius humanitaris i mediambientals. De la mateixa manera que passa en el món dels negocis, els projectes que utilitzen les dades com a valor social cobreixen un gran ventall de dimensions i propòsits.

De la mateixa manera que passa en el món dels negocis, els projectes que utilitzen les dades com a valor social cobreixen un gran ventall de dimensions i propòsits.

Algunes de les iniciatives més ambicioses són, per exemple, l’ús d’imatges de satèl·lit per situar els llocs d’actuació més urgents després d’un desastre natural, localitzar embarcacions de migrants que intenten creuar el Mediterrani, i detectar migracions massives d’animals. De manera similar, a través de reconeixement d’imatges també és possible localitzar víctimes de tràfic de persones i diagnosticar malalties a partir d’imatges mèdiques. La quantitat de projectes de gran envergadura que, gràcies a les dades, són capaços de contribuir a causes socials creix dia rere dia.

No obstant, això no vol dir que les dades només siguin útils per projectes humanitaris a gran escala. A escala local, les entitats que treballen per ajudar a les persones o al medi ambient que les envolta també poden aprofitar les seves dades (o el seu potencial d’obtenir-ne) per incrementar substancialment l’impacte de les seves accions. Com que en aquest àmbit acostuma a haver-hi manca de recursos i coneixements tècnics, organitzacions com DataForGoodBCN ofereixen assessorament i mentorització.

Què pot fer una entitat d’àmbit local amb les seves dades?

El primer que ha de fer una entitat social és adonar-se de què disposa d’unes dades que genera automàticament a partir de la seva activitat. Un exemple serien les dades del col·lectiu pel qual treballa (dades personals bàsiques de persones sense-sostre, escoles que necessiten recursos bàsics) o bé també sobre els seus socis i sòcies i col·laboradors i col·laboradores (dades personals, pagaments, quotes…). Totes aquestes dades ja són útils per extreure conclusions.

Aquesta gran varietat de dades que es pot generar és una eina molt potent per millorar la presa de decisions en una entitat social. Mitjançant les dades típiques d’una entitat social es pot, per exemple, predir el cessament en el pagament de les quotes, generar un conjunt de perfils per entendre quin tipus de persona dóna suport a l’entitat o visualitzar les dades dinàmicament mitjançant un dashboard d’una manera clara i eficaç. Així, es poden llençar campanyes més efectives a les xarxes socials, fer informes més complets o, fins i tot, decidir quines inversions són més rendibles i quines menys. A més a més, en cas que s’hagin recollit prou dades sobre l’activitat que realitza l’entitat, es poden arribar a millorar els serveis que s’ofereixen, de manera que qui rebi prestacions també se’n pugui beneficiar.

Imatge d'una estadística

Com començar a treballar?

Hi ha moltes maneres de recol·lectar dades. El més natural és començar a emmagatzemar-les de manera automàtica en un full de dades, com l’Excel. No obstant, es recomana no trigar gaire a estudiar l’opció d’un software especialitzat per a entitats sense ànim de lucre, que permeti la gestió de persones i quotes de manera senzilla. Aquests programes informàtics també emmagatzemen les dades ordenadament i són un bon començament per fer una gestió estructurada de les dades. Així, el dia que es vulgui començar a treballar amb les dades per potenciar l’entitat, aquestes es podran extreure fàcilment i, amb l’ajuda del software, estaran ben estructurades.

Ètica, legalitat i bones pràctiques

Ara bé, no tot són flors i violes. Estem parlant de tenir un criteri ètic, conèixer la legalitat vigent i respectar la privadesa i sobirania de les dades (bones pràctiques). Aquests tres factors ens exigeixen valorar els drets de les persones juntament amb els beneficis del col·lectiu pel qual treballa l’entitat.

És obligat, doncs, analitzar meticulosament els resultats basats en el coneixement de les dades i valorar-los amb ull crític per tal d’aplicar-los èticament.

El risc de la presa de decisions basada en dades també pot comportar actuar seguint un biaix implícit en les dades. És molt conegut el cas dels jutjats dels Estats Units en què els juristes s'ajudaven d'un algorisme per decidir sobre la presó preventiva. Aquest s'alimentava d'un conjunt de dades històriques sobre la reincidència delictiva. Les dades de raça van ser eliminades per evitar el biaix i, així i tot, l’algorisme presentava un biaix respecte a les persones negres, que eren enviades a presó preventiva amb una proporció exageradament alta. El problema era que el conjunt de dades històriques estava esbiaixat segons la raça i l’algorisme va aprendre que les persones de raça negra eren més reincidents. És obligat, doncs, analitzar meticulosament els resultats basats en el coneixement de les dades i valorar-los amb ull crític per tal d’aplicar-los èticament.

Pel que fa a la legalitat, cal saber que el mes de maig del 2018 va entrar en vigor una llei europea, la famosa LOPD (GDPR en anglès). Aquesta llei va augmentar la protecció de dades personals actuant directament en totes les fases de les dades: la recol·lecció, l’emmagatzematge, el processament, la transferència i la divulgació. És una llei molt extensa i complexa però, per començar, el més important és entendre que s’ha de protegir la privacitat de qui ha generat les dades i que és ell o ella qui en té la sobirania i, tant si se’n beneficia com si no, cal demanar-li permís explícit per emmagatzemar-les i fer-les servir amb objectius propis.

En aquest sentit, és important recordar que, encara que s’anonimitzin les dades, altres camps com el codi postal, el sexe o la combinació de diversos conjunts de dades, pot comportar la reidentificació d’individus o grups d’individus, sotmetent-los a possibles perjudicis.

Finalment, respectar un codi ètic de bona conducta es podria resumir en: ser transparent amb què es fa amb les dades, protegir les dades de tercers, conèixer la regulació i els límits que imposen, i treballar èticament preservant la qualitat de les dades.