[Gfoss] Facciamo un fork dei dati Istat?
Niccolo Rigacci
niccolo at rigacci.org
Sat Apr 14 19:42:59 CEST 2007
Continuo lo sproloquio in pubblico...
Necessità del fork
------------------------------
- Dati Istat aggiornati al 1991, gli (eventuali)
aggiornamenti non sono disponibili in tempo reale.
Nuove province, residenti, coordinate più precise, ecc.
- La comunità non può intervenire per migliorare i
dati Istat. In caso di nuovo rilascio da parte di
Istat gli interventi migliorativi vanno persi.
Es. tutto il lavoro che ho fatto per la correzione dei
toponimi; l'Istat ha ancora dati in maiuscolo con gli
apostrofi al posto dell'accento (es. VESTIGNE') oppure
sconosce l'uso dell'accento acuto (Gressoney La Trinitè
invece di Gressoney La Trinité).
- I dati Istat non sono disponibili in download
facile e rapido.
I dati in mio possesso sono 8100 record completi (escluso il
collegamento a Wikipedia e Geonames) più un totale di 51594
centri abitati minori (privi del numero di residenti e
col toponimo da normalizzare).
Questo il tracciato record che ho buttato giù:
Centro abitato
------------------------------
- ID
- Tipo
- Toponimo
- idprovincia (codice Istat)
- idcomune (codice Istat)
- idcentro (codice Istat)
- Coordinate
- Residenti
- Collegamento a it.wikipedia.org
- Collegamento a www.geonames.org
Tipo di centro abitato
------------------------------
- Capoluogo di regione
- Capoluogo di provincia
- Capoluogo comunale
- Centro abitato
Province
------------------------------
- idprovincia (codice Istat)
- idregione (codice Istat)
- Toponimo
- Residenti
Regioni
------------------------------
- idregione (codice Istat)
- Toponimo
Relazione con la categoria "Comuni italiani" di it.wikipedia.org
--------------------------------------------------------------------
Valore aggiunto rispetto a Wikipedia:
- Download del database facile e veloce
- Visualizzazione su mappa (una libera e una Google map)
- Accesso tramite WFS
E' immaginabile uno strumento automatico per verificare
l'allineamento dei dati, segnalando i casi di
differenza/incompletezza (con logica fuzzy?).
Lo scambio di informazioni da e verso wikipedia potrebbe
essere effettuato con strumenti semiautomatici.
Relazione con www.geonames.org
--------------------------------------------------------------------
Valore aggiunto rispetto a Geonames:
- Dati non presenti in Geonames (appartenenza a
provincia/regione, residenti, ...).
- Base dati di partenza più completa e controllata.
E' immaginabile uno strumento automatico che verifichi la
presenza del dato Istat su Geonames (un po' di fuzzy su
toponimo e coordinate) e provveda a caricare su Geonames
i dati mancanti.
Non credo che sia immaginabile il viceversa: i dati di Geonames
sono poco dettagliati per poter arricchire il database Istat.
--
Niccolo Rigacci
Firenze - Italy
Iraq, missione di pace: 61294 morti - www.iraqbodycount.net
More information about the Gfoss
mailing list