[Gfoss] Quale formato?

Andrea Peri aperi2007 a gmail.com
Mar 11 Nov 2014 22:51:45 CET


Grazie giohappy per il contributo su GeoJSON.
Sospettavo una cosa di tale genere, ma conosco solo superficialmente
il json e per ninete il geojson.
Per cui non potevo essere sicuro della cosa.
Sicuramente un forato testuale deve permettere di definire in qualche
modo il character-set che e' stato impiegato per costruirlo (almeno
uno se ci si vuole limitare
a definire il Character-set del dataset. Meglio sarebbe poter definire
un CS per ogni record. Csa che allieverebbe molto il problema del
copia/incolla
da fonti differenti.

Quindi aggiungo l GeoJSON la mancanza di un character-set definibile.

Conrocdo anche sulla pesantezza a livello di memoria.
In effetti il GeoJAON se opera come il JSON (non vedrei ragioni
perche' faccia differente)
deve essere caricato completamente prima di poter passare al parsing e
estrarre anche un solo record.

Questa non è una caratteristica di accesso random.
Ma bensi' e' una feature importante in un caricamento sequenziale.
Ovvero se il dispositivo di destinazione non è in grado di caricare
l'intero dataset tutto in un colpo solo
dovrebbe potersi gestire il caricamento a pezzettoni.

1 primi 1000 records, poi i secondi 1000, e cosi' via, per gestire un
caricamento sequnziale ma a pezzetti.
Una cosa di tale genere e' importante in uno scambio di dati.

quindi aggiungo questi due difetti alla lista.

--------------------------------------
dif = "e' difetto per"
nodif = "non è difetto per"
-------------------------------------
Lista difetti del formato ESRI Shapefile

.)non prevede l'indicazione del CharacterSet

dif: 1   nodif: 0

.)e' limitato nella dimensione del record

dif: 1    nodif: 0

.)limita di 10 caratteri al nome di un campo

dif: 1    nodif: 0

.)non supporta geometrie complesse (solamente punti linee e poligoni,
simple e multi)

dif: 1    nodif: 0

.)ha un limite di 2GB per la parte alfanumerica (file dbf)

dif: 1    nodif: 0

.)ha un limite di 2 GB per la parte geometrica

dif: 1    nodif: 0

.)le geometrie sono in doppia-precisione (nel senso di una definizione
del numeor di tipo binario ad aritmetica finita)

dif: 1    nodif: 1

.)non possiede l'indicazione del NULL nei valori alfanumerici

dif:1    nodif: 0

.)non ha standardizzato l'indice spaziale

dif: 1    nodif: 0

.)la presenza di formati leggermene difformi sul dbf impatta anche
sullo shapefile

dif: 1    nodif: 0

.)la separazione fisica tra shp e dbf fa' si' che un editing separato
(mediante excel ad esempio) del dbf provoca la perdita del link con la
geometria corrispondente

dif: 1     nodif: 1

.) mancanza di un vero formato data e time

dif: 1    nodif: 1

.) manca un formato blob interno (solo esterno tramite un file acessorio)

dif: 2    nodif: 0

.) la geometria non ha lo srid definito (solo un file prj esterno ma
opzionale e non standardizzato)

dif: 2    nodif: 0

.) la geometria non definisce in maniera chiara e inequivocabile
l'exterior ring e gli holes

dif: 1    nodif: 1

.) composto di 3 files distinti e indipendenti

dif: 1    nodif: 1

.) il campo testo e' limitato a 255 caratteri

dif: 1    nodif: 0

=====
Lista difetti del GeoJSON

.) non supporta indici spaziali (poco efficiente per grandi moli di dati)

dif: 2   nodif: 0

.) non ha un accesso random al dato
(spiegazione: questo non appare essere usualmente un difetto per un
formato di scambio, ma potrebbe esserlo in alcuni casi limite.)

.) non permette di definire un Character-set (ne' a livello di
dataset, ne' a livello di singolo record)

dif: 2   nodif: 0

.) richiede necessariamwnte la lettura dell'intero dataset (l'intero
file) prima di poterne decodificare i contenuti.

dif: 2   nodif: 0

=====
Lista difetti dello SpatiaLite

.) overhead dimensionale non trascurabile (4mb) che limita il suo
impiego quando i dati sono pochi.

dif: 1  nodif: 1

.) non consente la rinomina o la cancellazione di una colonna

dif: 1  nodif: 1

.) gli attuali software gis che lo supportano in scrittura (qgis only)
non permettono un agevole salvataggio su di esso.

dif: 1  nodif: 1

.) A giro ci sono troppe versioni.
(spiegazione: sebbene le api piu' recenti consentano di leggersi i
formati piu' vecchi. In uno scambio di dati non è detto che si vada da
vecchio verso nuovo. Ci sono anche dei tools di trasformazione, ma
questo esula dall'obiettivo di un formato di scambio che non deve
richiedere ulteriori trattamenti per consentire il trasporto ei dati)

dif: 2 nodif: 0

-------------

FINE (per ora).


Il 11 novembre 2014 22:36, G. Allegri <giohappy a gmail.com> ha scritto:
> Giusto una nota a valle di tutta la discussione. GeoJSON e gli altri formati
> testuali soffrono, a mio avviso, di un difetto ancora maggiore: che i dati
> sono testuali, appunto.
> A parte la conseguente pesantezza in termini di memoria richiesta, tutti i
> dati numerici soffrono di problemi di interpretazione e di interoperabilità
> [1].
>
> giovanni
>
> http://tools.ietf.org/html/rfc7159.html#section-6
>



-- 
-----------------
Andrea Peri
. . . . . . . . .
qwerty àèìòù
-----------------


Maggiori informazioni sulla lista Gfoss