<div dir="ltr"><div><div><div><div><div><div>Qui si entra in un mondo ai piu' insospettato e pieno di sorprese.<br><br></div>FAccio una domanda:<br></div>come si fa' a dedurre il charaxcter-set usato per produrre uno shapefile ?<br>
<br></div>Ovvero. Se arriva uno shapefile , esiste un modo per capire il suo character-set ?<br></div>Non credo.<br><br></div>A volte capita che l'interlocutore non ha idea di cosa si sta' parlando e finisce per chiedere a noi di dirgli quale è il character-set dei dati da lui prodotti.<br>
.<br>L'unica soluzione pratica a volte è tentare , se si riesce a stabilire , parlando con chi ha realizzato il dataset, con che sistema operativo e con quale software ha lavorato (se si ha fortuna).<br><br>Allora si deve ricorrere a una sorta di indagine indiretta.<br>
Chiedendo in quale sistema operativo si è operato e con quale software.<br></div><div>A volte, con un po' di fortuna ci si riesce a risalire.<br><br></div><div>Questa cosa non è cosi' semplice quando l'interlocutore è una ditta.<br>
</div><div>Le quali spesso affidano a terze parti il lavoro commissionatogli e il nostro stesso interlocutore non ha idea lui medesimo chi realmente ha realizzato lo shapefile, con cosa ha lavorato.<br><br></div><div></div>
<div>Poi, nei casi peggiori capita pure che la ditta seziona il lavoro a piu' soggetti , ognuno operante con prodotti propri e differenti,<br>e poi rimette tutto insieme senza roppo badare a cosa sta facendo.<br><br>Idem con i lavori svolti in enti che tipicamente lavorano su gruppi , come ad esmepio universita' o altre strutture del mondo accademico.<br>
Dove ovviamente i lavori sono organizzati a gruppi, ma all'intenro dei quali spesso ogni singolo operatore (studente) lavora come crede meglio e come sa' fare. E quindi ci sara' chi usa mac, 
chi linux e chi windows.<br><br></div><div>Per cui non è assolutamente infrequente che quello che arriva siano dei mix di vari character-sets.<br><br></div><div>A volte ci è capitato di ricevere dati in forma testuale, dove, nel medesimo file di testo ,<br>
alcune parti erano dotate di CRLF, altre di CR e infine alcune solo di LF !!<br><br></div><div></div><div>E ce ne volle del bello e del brutto per spiegare alla ditta di turno che questo era un errore.<br><br></div><div>E poi ci sono i lavori in cui il dataset passa attraverso varie mani in cascata.<br>
Ognuna approta delle modifiche.<br>Anche qui, se cambia il computer, e si cambia radicalmente la macchina il character-set cambia.<br></div><div><br>E qui le cose diventano veramente difficili, perche' se si passa da una macchina con CS X1 a una macchina con CS X2,<br>
non è vero che si passa a CS X2, dipende cosa si è effettuato.<br><br>Se si è editato 3 record, ci sta' che solo quei 3 records abbiano cambiato Character-set, mentre gli latri restino con vecchio X1.<br></div><div>Invece se si è rigenerato tutto lo shapefile perche' si è fatto ,  ad esempio, un buffer allora tutto lo shapefile èè passato a X2.<br>
<br></div><div>Per cui è anche difficile credere che in uno shapefile tutti i records abbiano il medesimo Character-set.<br><br></div><div>Vedi che è un bel casino.<br><br></div><div>Andrea.<br><br></div><div><br></div><div>
</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">Il giorno 03 dicembre 2013 16:23,  <span dir="ltr"><<a href="mailto:a.furieri@lqt.it" target="_blank">a.furieri@lqt.it</a>></span> ha scritto:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">On Tue, 03 Dec 2013 15:14:52 +0100, Maurizio Napolitano wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
- sulla parte degli open formats aggiungerei qualcosa in merito a<br>
qualche piccola attenzione come l'obbligo di fornire il .prj per il<br>
formato .shp o la versione per il formato dxf.<br>
<br>
</blockquote>
<br></div>
sempre per la serie "attenzione ai micro-dettagli":<br>
<br>
sarebbere estremamente utile indicare sempre esplicitamente il<br>
charset-encoding (UTF-8, CP1252, CP850 ...) utilizzato per<br>
produrre i vari datasets in formati che non prevedono nessuno<br>
standard in merito e che non supportano nessuna forma di<br>
auto-documentazione.<br>
vedi <a href="http://p.es" target="_blank">p.es</a>. .DBF (.SHP) oppure .TXT, .CSV etc etc<br>
<br>
di norma quasi nessuno (neppure all'estero) si degna mai<br>
di indicare chiaramente questa informazione.<br>
eppure e' assolutamente critica, visto che un'impostazione<br>
errata puo' anche arrivare a rendere del tutto impossibile<br>
l'importazione  di quei dataset <a href="http://p.es" target="_blank">p.es</a>. all'interno di un DBMS,<br>
o puo' comunque causare una ricca fioritura di "caratteri pazzi"<br>
in corrispondenza di qualsiasi vocale accentata o di qualunque<br>
altro segno diacritico particolare non coperto dal charset<br>
ASCII nudo e crudo.<br>
<br>
ciao Sandro<br>
______________________________<u></u>_________________<br>
<a href="mailto:Gfoss@lists.gfoss.it" target="_blank">Gfoss@lists.gfoss.it</a><br>
<a href="http://lists.gfoss.it/cgi-bin/mailman/listinfo/gfoss" target="_blank">http://lists.gfoss.it/cgi-bin/<u></u>mailman/listinfo/gfoss</a><br>
Questa e' una lista di discussione pubblica aperta a tutti.<br>
I messaggi di questa lista non hanno relazione diretta con le posizioni dell'Associazione GFOSS.it.<br>
666 iscritti al 22.7.2013</blockquote></div><br><br clear="all"><br>-- <br>-----------------<br>Andrea Peri<br>. . . . . . . . . <br>qwerty àèìòù<br>-----------------<br>
</div>