[Gfoss] Facciamo un fork dei dati Istat?

Niccolo Rigacci niccolo at rigacci.org
Sat Apr 14 19:42:59 CEST 2007


Continuo lo sproloquio in pubblico...

Necessità del fork
------------------------------
- Dati Istat aggiornati al 1991, gli (eventuali)
  aggiornamenti non sono disponibili in tempo reale.
  Nuove province, residenti, coordinate più precise, ecc.

- La comunità non può intervenire per migliorare i
  dati Istat. In caso di nuovo rilascio da parte di
  Istat gli interventi migliorativi vanno persi.
  Es. tutto il lavoro che ho fatto per la correzione dei
  toponimi; l'Istat ha ancora dati in maiuscolo con gli
  apostrofi al posto dell'accento (es. VESTIGNE') oppure
  sconosce l'uso dell'accento acuto (Gressoney La Trinitè
  invece di Gressoney La Trinité).

- I dati Istat non sono disponibili in download
  facile e rapido.

I dati in mio possesso sono 8100 record completi (escluso il
collegamento a Wikipedia e Geonames) più un totale di 51594
centri abitati minori (privi del numero di residenti e
col toponimo da normalizzare).


Questo il tracciato record che ho buttato giù:

Centro abitato
------------------------------
- ID
- Tipo
- Toponimo
- idprovincia (codice Istat)
- idcomune (codice Istat)
- idcentro (codice Istat)
- Coordinate
- Residenti
- Collegamento a it.wikipedia.org
- Collegamento a www.geonames.org

Tipo di centro abitato
------------------------------
- Capoluogo di regione
- Capoluogo di provincia
- Capoluogo comunale
- Centro abitato

Province
------------------------------
- idprovincia (codice Istat)
- idregione (codice Istat)
- Toponimo
- Residenti

Regioni
------------------------------
- idregione (codice Istat)
- Toponimo


Relazione con la categoria "Comuni italiani" di it.wikipedia.org
--------------------------------------------------------------------
Valore aggiunto rispetto a Wikipedia:
- Download del database facile e veloce
- Visualizzazione su mappa (una libera e una Google map)
- Accesso tramite WFS

E' immaginabile uno strumento automatico per verificare
l'allineamento dei dati, segnalando i casi di
differenza/incompletezza (con logica fuzzy?).

Lo scambio di informazioni da e verso wikipedia potrebbe
essere effettuato con strumenti semiautomatici.


Relazione con www.geonames.org
--------------------------------------------------------------------
Valore aggiunto rispetto a Geonames:
- Dati non presenti in Geonames (appartenenza a 
  provincia/regione, residenti, ...).
- Base dati di partenza più completa e controllata.

E' immaginabile uno strumento automatico che verifichi la
presenza del dato Istat su Geonames (un po' di fuzzy su
toponimo e coordinate) e provveda a caricare su Geonames
i dati mancanti.

Non credo che sia immaginabile il viceversa: i dati di Geonames
sono poco dettagliati per poter arricchire il database Istat.


-- 
Niccolo Rigacci
Firenze - Italy

Iraq, missione di pace: 61294 morti - www.iraqbodycount.net



More information about the Gfoss mailing list