[Gfoss] Rilascio versione aggiornata {v.2.2} per SpatiaLite

Mer 17 Set 2008 23:36:47 CEST

Andrea Peri ha scritto:
> MI rendo conto di essere stato troppo sintetico, per cui cerco di
> spiegarmi meglio:
>
> Chiaramente, in generale, se si usa UTF-8, le lettere accentate si
> possono sempre usare.
> Pero' andrebbero codificate.
>
> ad esempio in xml, quando la coifica e' UTF-8, la lettera accentata si
> puo' codificare ad esempio con codici del tipo:
> "&agrave;" e cosi' via.
>
> La domanda che ponevo e'
> se in sqlite e' prevista una gestione delle lettere accentate e quindi
> una loro codifica/decodifica, o se e' demandata allo sviluppatore
> che deve codificarsele/decodificarsele autonomamente.
>
> Andrea.
>   
UTF-8 rappresenta uno schema di codifica realmente universale (Unicode),
nel senso che qualsiasi carattere di qualsiasi charset può essere 
rappresentato
come UTF-8; e tutti gli schemi di codifica sono implementati nella 
specifica.

In pochi spiccioli:
- i caratteri ASCII usano un singolo byte
- i caratteri ISO-8859.xx (latin-1 etc) usano due bytes
- i caratteri "esotici" (cinese, giapponese etc) usano 3 bytes
- alcuni caratteri particolarmente "strani" possono richiede 4 bytes

In pratica UTF-8 rappresenta una versione "più furba" di UTF-16;
entrambi sono comunque in grado di incapsulare egregiamente
qualsiasi altra codifica, e quindi sono realmente universali

la libreria GNU libiconv supporta adeguatamente tutte le
conversioni del caso, consentendo di trasformare qualunque
tipo di charset in UTF-8

Se p.es. devi importare in SpatiaLite / SQLite uno shp che hai
generato sul tuo PC Windows, basta semplicemente che
tu dichiari al momento dell'importazione che lo shp è codificato
come CP1252 Windows-Latin 1; se poi trasferisci quel
DB sqlite su un PC Ubuntu (Linux usa nativamente UTF-8),
vedrai che tutte le accentate verranno comunque visualizzate
nel modo corretto senza bisogno di nessuna ulteriore
conversione.

ciao Sandro