[Gfoss] Trovare errori encoding

Sandro Santilli strk a keybit.net
Mer 20 Apr 2016 14:00:27 CEST


On Wed, Apr 20, 2016 at 09:45:19AM +0200, Marco Guiducci wrote:
> On Tue, 19 Apr 2016 16:42:54 +0200
> Sandro Santilli <strk a keybit.net> wrote:
> 
> > On Sat, Apr 16, 2016 at 07:17:42AM +0200, Paolo Cavallini wrote:
> > 
> > > La domanda: sapete che si sia una query già pronta, o un altro sistema,
> > > per accorgersi se in una tabella c'è un qualsiasi carattere "strano",
> > > convertito non correttamente?
> > 
> > Non e' facile definire "strano".
> > Forse potresti fare una lista di caratteri "non strani"
> > e controllare che tutti i caratteri nei valori di un campo
> > siano presenti in quel set.
> 
> di solito sono quelli oltre il 127 ascii.

Beh, le lettere accentate italiane non sono in quella fascia
(per esempio).

> fare una analisi preventiva dei dati comporta comunque sapere il set di caratteri usato.

Infatti la stessa definizione di carattere non puo' prescindere
dall'encoding. Per determinare se un carattere e' strano devi prima
determinare cosa sia un carattere, potrebbe essere definito come un
solo byte oppure come multibyte...

> ad esempio nelle specifiche tecniche di RT i dati devono essere consegnati in cp1252.

Perche' non UTF8 ?

--strk;

  ()   Free GIS & Flash consultant/developer
  /\   http://strk.keybit.net/services.html


Maggiori informazioni sulla lista Gfoss