Alla data del 4 marzo 2020 – dopo circa 15 giorni dal primo caso “italiano” – non c’è in Italia una fonte ufficiale che pubblichi i dati in modalità machine readable sul Coronavisus o Covid-19.

Un dato è machine readable se puoi aprirlo con un foglio di calcolo come Excel quantomeno. Non lo è se è pubblicato semplicemente come una informazione in una parte di un sito internet oppure anche in una tabella scannerizzata (più info qui).

Per questa ragione abbiamo creato questo repository, dove scarichiamo, estraiamo e rendiamo disponibili a chiunque i dati ufficiali in formato machine readable, in modo da rendere il riutilizzo di questi dati più facile e accessibile. Questo repository viene aggiornato una volta al giorno – intorno alle 19:30 – per scaricare dal sito della Protezione Civile i 2 file PDF denominati Dati di riepilogo nazionale (pdf) e Dettaglio per provincia (pdf) e trasformarli in formati leggibili da una “macchina”.

I file sono aggiornati dalla Protezione Civile ogni giorno intorno alle 18:00 in maniera automatizzata, anche se chiaramente questo sistema potrebbe smettere di funzionare da subito, dopo una modifica effettuata dai gestori del sito della Protezione Civile.


Questa è l’occasione per chiedere anche noi al Ministero della Sanità e alla Protezione Civile di produrre – oltre a questi necessari file PDF pensati per fare la dovuta e utile rassegna stampa – dei file e/o dei servizi in formato machine readable, con licenza aperta, certificati, completi, il più possibile disaggregatiaggiornati e con lo storico dei dati nel tempo.

Cosa puoi fare per dare un contributo?

Grazie!

9 pensiero su “Coronavirus, abbiamo trasformato i dati ufficiali in formato machine readable ma chiediamo alle istituzioni di farlo da sole”
  1. Ho riscontrato un’incongruenza fra il totale positivi di oggi 3296 e la somma di terapia intensiva 351 ricoverati 1165 ed isolamento domiciliare 1790. Quest’ultima somma rileva 3306 totale positivi.

  2. sto cercando la serie storica dei pazienti ospedalizzati per Covid-19. Ho la serie storica dei contagiati (positivi) dei morti (a causa di o con coronavirus) ma non trovo il dato dei casi gravi (appunto quelli in ospedale)

  3. Bravissimi, ottima idea.

    E grazie anche per la segnalazione degli strumenti open per l’elaborazione dati.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *