Come associazione Ondata – ma non siamo certamente gli unici – ci capita spesso di batterci per l’apertura di dati pubblici, pungolando le istituzioni. Inutile negare che tante volte queste azioni di pressione si incagliano in discussioni infinite che non portano ai (nostri) risultati attesi. Nel caso dei dati sul coronavirus invece la grossa pressione che i cittadini hanno fatto sulle istituzioni preposte, sembra aver portato gli effetti sperati: il Dipartimento di Protezione Civile ha reso accessibili i dati in formato aperto e condiviso uno spazio di dialogo con i cittadini (qui su Github). Per arrivare a questi effetti abbiamo compiuto essenzialmente due azioni:
- Fare scraping dei dati ufficiali e trasformarli in formato machine readable: significa in parole povere che le fonti ufficiali li pubblicavano in pdf sui loro siti, mentre noi li abbiamo scaricati e trasformati in tabelle consultabili (e analizzabili! È questo il punto!) con fogli di calcolo come Excel o Libre Office Calc.
- Chiedere a gran voce sui social network che fossero direttamente le istituzioni a permetterne lo scarimento in formato machine readable
Il Sole24Ore ha scritto:
Anche grazie alla campagna online lanciata da OnData, sabato 7 marzo la Protezione civile ha implementato una mappa sul modello di quella della John Hopkins, consultabile anche da mobile. Inoltre ha aperto un repository su GitHub dove pubblica tutti i dati raccolti in queste settimane.
E così anche Skytg24:
I dati utilizzati nella maggior parte dei grafici e delle mappe questo articolo provengono dal Dipartimento della Protezione civile, dal Ministero della Salute e della Regioni così come sono raccolti sul sito del Ministero della Salute con aggiornamenti quotidiani. Questi dati non sarebbero utilizzabili in modo pratico ed efficiente senza l’azione dell’assocazione onData che, con un’opera di volontariato, li rende disponibili in formato leggibile dalle macchine. Per questa ragione onData viene citata come fonte nelle visualizzazioni realizzate anche grazie al suo lavoro sui dati.
Indubbiamente si tratta di un caso, una circostanza episodica: sappiamo bene che la strada è ancora molto lunga per ottenere opendata in maniera costante e qualitativamente di alto livello da tutte le istituzioni pubbliche. Quello che in questa circostanza sembra essere cambiato è la partecipazione: una enorme quantità di persone si è unita a gran voce alla richiesta di avere questi dati in formato aperto e accessibile, e questo fatto – al di là degli esiti positivi – è un segnale molto rilevante della necessità e della volontà che sempre più cittadini nutrono per l’accesso ai dati pubblici.
Inoltre: non solo la domanda di #opendata è venuta da tanti, ma molti più del solito hanno dato per scontato il valore dei dati machine readable, molti più del solito hanno insistito sul fatto che i dati rilasciati fossero di maggiore qualità. Forse durante un’emergenza terribile come quella che stiamo vivendo, emerge un piccolo cambiamento culturale nel mondo dei dati che è un auspicio non da poco rispetto a quello che accadrà attorno agli open data nei prossimi anni.
L’Istituto Superiore di Sanità – che è certamente una delle fonti primarie, dei dati pubblicati dal Dipartimento della Protezione Civile – ha nel proprio sito una sezione denominata “Sorveglianza integrata COVID-19: i principali dati nazionali“, con un’infografica giornaliera, un documento esteso, e un appendice al bollettino con il dettaglio regionale.
Quest’ultimo è di particolare interesse e fa emergere dati “nuovi” sia in termini di spazializzazione (dati aggregati anche per Comune e non soltanto per Provincia) e dati sulle fasce di età delle persone coinvolte (vedi immagine di sotto). Tutto in PDF 😟
È necessario evitare di utilizzare un formato per dati non strutturati (e.g., PDF) in presenza di dati strutturati.
Non lo diciamo noi, ma le “Linee guida nazionali per la valorizzazione del patrimonio informativo pubblico” (grazie Giorgia per sottolinearlo sempre).
Chiediamo all’ISS pertanto di pubblicare (ad esempio) i dati su Comune, Età, Sesso anche in formato machine readable, e/o “convogliare” anche questi nel prezioso repository GitHub della Protezione Civile.