[Gfoss] http://www.regione.toscana.it/-/open

Andrea Peri aperi2007 a gmail.com
Mar 3 Dic 2013 17:07:27 CET


Qui si entra in un mondo ai piu' insospettato e pieno di sorprese.

FAccio una domanda:
come si fa' a dedurre il charaxcter-set usato per produrre uno shapefile ?

Ovvero. Se arriva uno shapefile , esiste un modo per capire il suo
character-set ?
Non credo.

A volte capita che l'interlocutore non ha idea di cosa si sta' parlando e
finisce per chiedere a noi di dirgli quale è il character-set dei dati da
lui prodotti.
.
L'unica soluzione pratica a volte è tentare , se si riesce a stabilire ,
parlando con chi ha realizzato il dataset, con che sistema operativo e con
quale software ha lavorato (se si ha fortuna).

Allora si deve ricorrere a una sorta di indagine indiretta.
Chiedendo in quale sistema operativo si è operato e con quale software.
A volte, con un po' di fortuna ci si riesce a risalire.

Questa cosa non è cosi' semplice quando l'interlocutore è una ditta.
Le quali spesso affidano a terze parti il lavoro commissionatogli e il
nostro stesso interlocutore non ha idea lui medesimo chi realmente ha
realizzato lo shapefile, con cosa ha lavorato.

Poi, nei casi peggiori capita pure che la ditta seziona il lavoro a piu'
soggetti , ognuno operante con prodotti propri e differenti,
e poi rimette tutto insieme senza roppo badare a cosa sta facendo.

Idem con i lavori svolti in enti che tipicamente lavorano su gruppi , come
ad esmepio universita' o altre strutture del mondo accademico.
Dove ovviamente i lavori sono organizzati a gruppi, ma all'intenro dei
quali spesso ogni singolo operatore (studente) lavora come crede meglio e
come sa' fare. E quindi ci sara' chi usa mac, chi linux e chi windows.

Per cui non è assolutamente infrequente che quello che arriva siano dei mix
di vari character-sets.

A volte ci è capitato di ricevere dati in forma testuale, dove, nel
medesimo file di testo ,
alcune parti erano dotate di CRLF, altre di CR e infine alcune solo di LF !!

E ce ne volle del bello e del brutto per spiegare alla ditta di turno che
questo era un errore.

E poi ci sono i lavori in cui il dataset passa attraverso varie mani in
cascata.
Ognuna approta delle modifiche.
Anche qui, se cambia il computer, e si cambia radicalmente la macchina il
character-set cambia.

E qui le cose diventano veramente difficili, perche' se si passa da una
macchina con CS X1 a una macchina con CS X2,
non è vero che si passa a CS X2, dipende cosa si è effettuato.

Se si è editato 3 record, ci sta' che solo quei 3 records abbiano cambiato
Character-set, mentre gli latri restino con vecchio X1.
Invece se si è rigenerato tutto lo shapefile perche' si è fatto ,  ad
esempio, un buffer allora tutto lo shapefile èè passato a X2.

Per cui è anche difficile credere che in uno shapefile tutti i records
abbiano il medesimo Character-set.

Vedi che è un bel casino.

Andrea.




Il giorno 03 dicembre 2013 16:23, <a.furieri a lqt.it> ha scritto:

> On Tue, 03 Dec 2013 15:14:52 +0100, Maurizio Napolitano wrote:
>
>> - sulla parte degli open formats aggiungerei qualcosa in merito a
>> qualche piccola attenzione come l'obbligo di fornire il .prj per il
>> formato .shp o la versione per il formato dxf.
>>
>>
> sempre per la serie "attenzione ai micro-dettagli":
>
> sarebbere estremamente utile indicare sempre esplicitamente il
> charset-encoding (UTF-8, CP1252, CP850 ...) utilizzato per
> produrre i vari datasets in formati che non prevedono nessuno
> standard in merito e che non supportano nessuna forma di
> auto-documentazione.
> vedi p.es. .DBF (.SHP) oppure .TXT, .CSV etc etc
>
> di norma quasi nessuno (neppure all'estero) si degna mai
> di indicare chiaramente questa informazione.
> eppure e' assolutamente critica, visto che un'impostazione
> errata puo' anche arrivare a rendere del tutto impossibile
> l'importazione  di quei dataset p.es. all'interno di un DBMS,
> o puo' comunque causare una ricca fioritura di "caratteri pazzi"
> in corrispondenza di qualsiasi vocale accentata o di qualunque
> altro segno diacritico particolare non coperto dal charset
> ASCII nudo e crudo.
>
> ciao Sandro
> _______________________________________________
> Gfoss a lists.gfoss.it
> http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss
> Questa e' una lista di discussione pubblica aperta a tutti.
> I messaggi di questa lista non hanno relazione diretta con le posizioni
> dell'Associazione GFOSS.it.
> 666 iscritti al 22.7.2013




-- 
-----------------
Andrea Peri
. . . . . . . . .
qwerty àèìòù
-----------------
-------------- parte successiva --------------
Un allegato HTML ? stato rimosso...
URL: <http://lists.gfoss.it/pipermail/gfoss/attachments/20131203/47db28f9/attachment-0001.html>


Maggiori informazioni sulla lista Gfoss