L’Agenzia delle Entrate gestisce l’Osservatorio del Mercato immobiliare:
Le quotazioni immobiliari semestrali individuano, per ogni delimitata zona territoriale omogenea (zona OMI) di ciascun comune, un intervallo minimo/massimo, per unità di superficie in euro a metro quadro.
Come ha scritto Patrizia Saggini nella mailing list di Spaghetti OpenData, l’agenzia mette a disposizione il servizio “Forniture dati OMI”, che consente il download gratuito – a partire dal 1° semestre 2016 – delle quotazioni immobiliari e dei volumi di compravendita (dettaglio comunale) dell’Osservatorio del Mercato immobiliare; per utilizzare questi dati, è necessario citare la fonte: “Agenzia Entrate – OMI”. I dati sono aggiornati semestralmente e destinati agli utenti registrati di Fisconline ed Entratel.
Vengono resi disponibili in formato CSV.
La modalità di pubblicazione ricorda un po’ la licenza Creative Commons Attribuzione, ma in realtà è cosa diversa: non è infatti una licenza aperta, perché non è specificato se sia possibile farne un uso anche commerciale (lo chiederemo).
Abbiamo creato un repository GitHub per:
- rendere disponibili i dati sulle “Quotazioni Immobiliari” anche a chi non è registrato (fonte “Agenzia Entrate – OMI”);
- pubblicarli in modo che siano pronti all’uso. Non lo sono per queste principali ragioni:
- contengono una riga di intestazione “inutile”, che serve soltanto come didascalia;
- hanno un separatore di campo a fine linea, ma nei CSV (si vedano le spefiche del formato) non ci devono essere: The last field in the record must not be followed by a comma;
- non è dichiarato l’encoding. Ne abbiamo fatto l’inferencing e sembra che sia più d’uno; pertanto sono stati tutti impostati come
UTF-8
; - sono divisi in file semestrali a partire da inizio 2016, distribuiti su due categorie (le zone OMI e i valori), per un totale di 12 file. Li abbiamo riuniti in 2, uno per ogni categoria.
Nota sulla validità di questi dati
Luca Elle ci ha segnalato (grazie) che con “sentenza n. 3197 del 9 febbraio 2018 le quotazioni OMI possono essere prese in considerazione per individuare un valore presunto ribadendo che sono idonee solamente a “condurre ad indicazioni di valori di larga massima”“.
Ci ha indicato che “non sono considerati validi per valutazione immobiliare con metodi internazionali (ad esempio RICS) e nemmeno l’ABI lo riconosce più come valutazione ufficiale“.
Come sono stati raccolti i dati
Per richiederli – procedura appresa grazie alle note di Carlo – occorre aprire la pagina https://telematici.agenziaentrate.gov.it/Main/index.jsp e autenticarsi.
Una volta fatto, fare click su “Servizi ipotecari e catastali, Osservatorio Mercato Immobiliare” (tra i servizi presenti nel box nella parte sinistra della pagina), poi click sulla sottovoce “Forniture OMI – Quotazioni Immobiliari” e da lì infine è possibile fare le richieste per comune, regione o per l’intero territorio nazionale.
Abbiamo richiesto quelle per l’intero territorio.
Per i dettagli sui dati si può fare riferimento alla pagina dedicata dell’Agenzia “Manuali e guide”.
La struttura del repository
È diviso in queste sottocartelle:
rawData
, che contiene i file “grezzi”, così come scaricati dal sito dell’Agenzia;doc
, con i file di documentazione scaricati dalla pagina ufficiale “Manuali e guide”;data
, con i dati da noi rielaborati.
I file CSV originali sono stati così rielaborati:
- encoding impostato a
UTF-8
; - rimosse intestazioni inutili e separatore di campo inserito erroneamente a fine linea;
- nei file delle zone, nel campo
Zona_Descr
è presente un apice singolo a inizio e fine cella. È stato rimosso, perché inutile e potrebbe dare dei problemi in lettura; - è stata fatta l’unione dei 6 file delle “Zone OMI” e dei 6 per i “Valori” in due file, rispettivamente zone.7z e valori.7z; quello sui valori è un file di circa 1 milione di righe. A questi è stata aggiunta la colonna
file
per poter risalire ad anno e semestre di ogni riga; - ai valori numerici è stata applicata la “rappresentazione” anglosassone, con il
.
come separatore dei decimali (questo però soltanto nei due file “zone.csv” e “valori.csv”).
Nella radice c’è lo script bash (zoneOMI.sh
), usato per la trasformazione dei file “grezzi” originali a quelli da noi rielaborati.
Note
Circa il 10% dei dati sui valori ha valori di Loc_min
e Loc_max
pari a 0
.
Purtroppo sembra non sia possibile scaricare in blocco, per tutto il territorio nazionale, i file cartografici delle zone. Questo limita l’utilizzo in termini di analisi dei dati raccolti.
Una licenza non “chiaramente” definita è un limite all’utilizzo.
Sono dati che dovrebbero essere pubblicati anche nel portale nazionale italiano sui dati aperti; ma ovviamente dopo avergli applicato una licenza adeguata.