[Gfoss] Facciamo un fork dei dati Istat?

andrea giacomelli pibinko at gmail.com
Sun Apr 15 13:17:11 CEST 2007


ottima sintesi niccolò - qua c'è materiale per tre giorni di ragionamenti.
bisogna che me la stampi!

l'idea è molto buona  e vale la pena elaborarla un poco: far emergere note,
potenziali problemi di manutenzione (ad es. i codici istat dei comuni
possono cambiare nel tempo), di trattamento intermedio (correzioni) e di
consultazione (posti con più nomi, bilinguismi ecc).

l'idea può essere realizzata in una settimana come 2 anni di lavoro...

due cose che farei prima di attivarsi

(a) decidiamo prima qual è l'obiettivo di questo database.
(b) capiamo chi c'è e chi non c'è per supportarne il raggiungimento.

penso che la cosa funzioni meglio via wiki. Paolo: si apre una paginetta ?

...io un un elenco di toponimi scaricato nel 1999 o giù di lì, e ce ne sono
trenta e rotti mila...sarei molto curioso di incrociarlo con i cinquantuno e
rotti di ora.

a presto

andrea, noto pibinko
http://pibinko.altervista.org



Il 14/04/07, Niccolo Rigacci <niccolo at rigacci.org> ha scritto:
>
> Continuo lo sproloquio in pubblico...
>
> Necessità del fork
> ------------------------------
> - Dati Istat aggiornati al 1991, gli (eventuali)
>   aggiornamenti non sono disponibili in tempo reale.
>   Nuove province, residenti, coordinate più precise, ecc.
>
> - La comunità non può intervenire per migliorare i
>   dati Istat. In caso di nuovo rilascio da parte di
>   Istat gli interventi migliorativi vanno persi.
>   Es. tutto il lavoro che ho fatto per la correzione dei
>   toponimi; l'Istat ha ancora dati in maiuscolo con gli
>   apostrofi al posto dell'accento (es. VESTIGNE') oppure
>   sconosce l'uso dell'accento acuto (Gressoney La Trinitè
>   invece di Gressoney La Trinité).
>
> - I dati Istat non sono disponibili in download
>   facile e rapido.
>
> I dati in mio possesso sono 8100 record completi (escluso il
> collegamento a Wikipedia e Geonames) più un totale di 51594
> centri abitati minori (privi del numero di residenti e
> col toponimo da normalizzare).
>
>
> Questo il tracciato record che ho buttato giù:
>
> Centro abitato
> ------------------------------
> - ID
> - Tipo
> - Toponimo
> - idprovincia (codice Istat)
> - idcomune (codice Istat)
> - idcentro (codice Istat)
> - Coordinate
> - Residenti
> - Collegamento a it.wikipedia.org
> - Collegamento a www.geonames.org
>
> Tipo di centro abitato
> ------------------------------
> - Capoluogo di regione
> - Capoluogo di provincia
> - Capoluogo comunale
> - Centro abitato
>
> Province
> ------------------------------
> - idprovincia (codice Istat)
> - idregione (codice Istat)
> - Toponimo
> - Residenti
>
> Regioni
> ------------------------------
> - idregione (codice Istat)
> - Toponimo
>
>
> Relazione con la categoria "Comuni italiani" di it.wikipedia.org
> --------------------------------------------------------------------
> Valore aggiunto rispetto a Wikipedia:
> - Download del database facile e veloce
> - Visualizzazione su mappa (una libera e una Google map)
> - Accesso tramite WFS
>
> E' immaginabile uno strumento automatico per verificare
> l'allineamento dei dati, segnalando i casi di
> differenza/incompletezza (con logica fuzzy?).
>
> Lo scambio di informazioni da e verso wikipedia potrebbe
> essere effettuato con strumenti semiautomatici.
>
>
> Relazione con www.geonames.org
> --------------------------------------------------------------------
> Valore aggiunto rispetto a Geonames:
> - Dati non presenti in Geonames (appartenenza a
>   provincia/regione, residenti, ...).
> - Base dati di partenza più completa e controllata.
>
> E' immaginabile uno strumento automatico che verifichi la
> presenza del dato Istat su Geonames (un po' di fuzzy su
> toponimo e coordinate) e provveda a caricare su Geonames
> i dati mancanti.
>
> Non credo che sia immaginabile il viceversa: i dati di Geonames
> sono poco dettagliati per poter arricchire il database Istat.
>
>
> --
> Niccolo Rigacci
> Firenze - Italy
>
> Iraq, missione di pace: 61294 morti - www.iraqbodycount.net
>
> _______________________________________________
> Gfoss mailing list
> Gfoss at faunalia.com
> http://www.faunalia.com/cgi-bin/mailman/listinfo/gfoss
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: http://www.faunalia.com/pipermail/gfoss/attachments/20070415/79754590/attachment.htm 


More information about the Gfoss mailing list