[Gfoss] formati liberi [era: dati geologici]

Andrea P. cerebrogis at ipergeo.org
Sat Nov 3 12:53:06 CET 2007


Firenze, 03/11/2007

>Mi sembra che in questa discussione ci sia un difetto dibase: la mancanza di definizione
>di "formato aperto" e "formato proprietario".
>A mio avviso, se le specifiche sono rilasciate ed usabili questo e' sufficiente perche' si
>possa parlare di formato aperto. Aperto ad essere visto e compreso in tutti i dettaglio.
>Usabile nel poter sviluppare software di conversione verso altri formati.

>Da un'altra pare mi viene in mente il formato ShockWaveFlash.
>E' un formato (non ben) documentato, ma la documentazione viene rilasciata con una EULA
>che ne vieta ai lettori lo sviluppo di software che interpreti tale formato.
>Specifiche rilasciate, ma non usabili.

Infatti io non lo userei mai per un mio progetto.

Pero' nel caso specifico di Flash occorre riconoscergli un deciso merito in quanto ha ricoperto un buco di funzionalita' che per anni ha 
attanagliato l' html del web.

Ricordo riunione fin dal 1997 in cui l'ordine del giorno era decidere se usare l' html con quello che ne seguiva in termini di pochezza di grafica o i formati 
shockwave (che all'epoca mi pare si chiamasse director) 

Giustamente vi era chi sosteneva che l'html era troppo misero in termini di restituzione grafica e da browser a browser le cose erano intepretate in maniera 
troppo differente da garantire una stabilita' di riproduzione.

Tieni presente che all'epoca vi era netscape 0.9 come unico browser gratuito, ancora IE non era neanche uscito.

Quando poi usci' IE comincio' la famosa guerra dei browsers che porto' tutti i competitors a rilasciare nuove evoluzioni assolutamente non standards nei tags 
html. Con la speranza di riuscire a stroncare l'avversario.

Ad esempio , le specifiche per i frame non erano parte integrante dell' html, ma furono una invenzione fatta da Netscape, che poi solo con il rilascio delle 
specifiche 3, furono adottate dal Cern in maniera ufficiale.

Qui mi ricollego al discorso che solo con delle specifiche stabili si riesce a compicciare qualcosa di credibile, durante la guerra dei browsers si assisteva a un 
fiorire di pagine html che di volta in volta serviva o netscape o IE per poter vedere, e spesso bisognava disporre di piu' versioni del medesimo browsers, 
perche' da una versione all'altra cambiavano le regole di interpretazione dei tags.
L'unico che teneva dritta la barra e garantiva una buona compatibilita' (anche se non eccezionale ) era proprio shockwave. Con esso cascavi sempre in 
piedi.

Poi, con  il passare del tempo il formato si e' affinato e specializzato. Pensa che permette persino di soddisfare le specifiche sull'accessibilita' , riuscendo a 
pilotare screen-readers e riproduttori sonori.

Per cui bisogna ammettere che il suo primato se lo e' conquistato sul campo, quando la ditta vi ha creduto e lo ha supportato e spinto anche contro giganti 
del calibro di Microsoft. In quanto rilasciare un nuovo plugin per tutte le piattaforme netscape, IE , ogni volta che usciva una nuova versione di browser, o di 
sistema operativo era senz'altro un impegno non indifferente.

Dopo di che' il fatto che la ditta che lo detiene lo consideri un bene della societa' e ne tenga stretto i diritti di sfruttamento, e' una scelta aziendale loro. Che 
solo il tempo potra' dire se e' giusta o sbagliata.

>Un'altro caso ancora e' il formato di un software di mappatura libero in cui sono incappato di recente
>che utilizza un formato "aperto" ma senza specifiche rilasciato (se non il codice stesso).
>Difficile utilizzarlo...

Capisco quello che dici.
Io ad esempio ancora non sono riuscito a trovare il link giusto per scaricare delle specifiche chiare sul formato di HSQLDB.
Un bellissimo prodotto, che sto' usando e ne sono entusiasta, ma che mi piacerebbe conoscere un po' meglio anche come formato, magari per farmi una 
libreria di lettura come piace a me, certo pero' non vorrei mettermi a leggere un codice sorgente in java per comprenderlo.

>Qui parliamo di stabilita' del formato, che e' un passo successivo.
>Ovviamente all'emergere di un nuovo formato c'e' sempre una fase di transizione, di adattamento.
>Ad esempio, io non mi trovo affatto bene con l'ascii esteso (8bit), l'UTF, l'Open Document Format, ...
>E' scomodo dover adattare tutto il proprio software a nuovi formati.
>Mi sono trovato scomodo (in passato) anche con le PNG (il mio browser non le supportava).

Mi pare fosse netscape, che fino alla versione 4 non supportava i png.

D'altronde il formato raster buono per tutte le stagioni non esisteva. Tra gif, png, e jpeg ognuno aveva i suoi difetti e non ne esisteva uno da potersi usare 
sempre. Questo anche senza contare il problema della licenza dei GIF (che ora e' superato).

La nuova generazione dei formati di cui l'ecw e il sid sono stati antesignani sono di livello senz'altro superiore.
Io penso che ora come ora il formato migliore sia il jpeg2000.
Pero' ancora i browser non mi risulta che lo supportino in maniera adeguata. 
E poi un annetto fa' ancora rilevavo alcuni problemini di compatibilita' nella portabilita' del formato JP2K tra viewers diversi .
Non so' se la situazione oggi e' migliorata.

>Sicuro, non basta che un formato sia aperto per adottarlo ad occhi chiusi.
>Ad ogni modo un formato senza specifiche pubbliche o senza legittimita' di interpretazione 
>e' indubbiamente da escludere nel momento in cui si usa per comunicare informazioni
>al pubblico, che e' quello che una PA fa o dovrebbe fare con la sua presenza web.

>Pensa se per leggere la gazzetta ufficiale bisognasse comprare un "decodificatore"...

non sono sicuro di aver capito completamente il discorso.

Infatti, devi tener presente che comunque la lingua italiana devi riuscire a leggerla per poter comprendere le informazioni contenute nella GU.
Diverso e' per l' EU che pubblica i suoi documenti in piu' lingue. In italia se non conosci l'italiano devi difatto comprare un "decodificatore" (poi cosa sia tale 
decodificatore e' un dettaglio) per leggerti la GU.

Se invece ti riferisci a delle eventuali versioni in formato digitale differenti tra loro. 
Anche in questo caso il discorso e' parziale.

Cito il caso del USGS americano che anziche' adottare uno standard esistente ha preferito farsi il suo e poi rilasciare un viewer e delle specifiche di tale 
formato.

Ipotizziamo per un attimo che avvenga lo stesso per la GU.
Se i documenti digitali venissero rilasciati con un formato digitale assolutamente criptico, ma intelleggibile da uno specifico viewer scaricabile dal sito 
apposito gratuitamente (ma closed source), e disponibile per le piu' svariate piattaforme. Il tuo assunto verrebbe rispettato.

Invece, mi pare di capire che la tua posizione sia piu' rivolta a auspicare che il formato digitale della GU sia rilasciato con un formato tale da permetterti di 
poterla leggere con il viewer che pare a te, senza dover sottostare a quello specifico che venisse fornito in bundle gratuito.

Oppure , ed e' differente, auspicare che sia pure rilasciata con un formato digitale inventato per l'occasione, ma purche' ci sia un buon doc di specifiche 
che permetta a persone volenterose di scriversi il proprio visualizzatore.


>Or metti a confronto l'accessibilita di questi formati
>(dai solo un'occhiata alle pagine su l'enciclopedia libera)

>            ASCII:  http://en.wikipedia.org/wiki/ASCII

>        Shapefile:  http://en.wikipedia.org/wiki/Shapefile
>	....

Purtroppo non riesco a essere un grande fruitore dei contenuti di wiki.
Per cui non sono abituato a percepirne certi risvolti.

Se intendi mostrarmi che di certi formati la notorieta' delle specifiche ne aumenta la conoscenza, mentre per altri sostanzialmente ignoti la conoscenza e' 
scarsa.

Niente da dire tutto vero.

Si noto anche che tutti i formati che mi hai segnalato sono tipici formati di interscambio dati. Piu' o meno evoluti.

E quindi come tali nascono di partenza con delle specifiche.

Infatti se voglio sviluppare un formato per archiviarmi dei dati si tratta di un formato che devo usare io all'interno del mio programma e per me il mondo finisce 
li'.
Se pero' penso di sviluppare un formato di interscambio , ovvero un formato che serva per poter spostare i dati da un ambiente a un altro (spostare i dati tra 
due pc o cose del genere), allora penserei che fosse quasi ovvio che le specifiche siano rilasciate altrimenti come fanno altri a interscambiare con me' ?

infatti citando il mondo esri e in particolare arcinfo workstation. La coverages famosissima nell'ambiente dei GIS, non e' un formato utile per fare 
l'interscambio. E per questo ESRI ha rilasciato le specifiche E00, ovvero delle specifiche per comporre i dati di una coverages in un formato 
interscambiabile tra piu' computers.

Anche lo shapefile nasce come formato interscambiabile, lo dice anche wiki .

ovviamente il GML e' il formato di interscambio per eccellenza.

mentre i formati raster, per loro natura non necessitano di formati di interscambio specifici, perche' non pongono molti problemi, trattandosi di una mappa di 
bit (pixel) memorizzata in una maniera piu' o meno organizzata, e finisce li'.

Nei formati vettoriali, invece ci si deve interscambiare la parte geometrica, la parte attributi, le relazioni tra geometrie, ricostruire le relazioni tra i files, e cosi' 
via. In un archivio di dati vettoriali ce ne sono di cose da interscambiarsi.

tanto per citare un esempio concreto.

Quando ESRI tiro' fuori dl cilindro ArcGIS, che conteneva al suo interno Arcinfo Workstation e comunque gia' con ArcGIS si poteva gestire le coverages, 
una cosetta che sostanzialmente era ignorata ai piu' e' che non vi era assolutamente compatibilita' tra una coverages elaborata da un arcinfo workstation 
su una macchina unix e una coverages scritta con arcinfo workstation su una macchina windows.
E questo per una ragione banalissima, su unix i percorsi erano salvati con il simbolo "/" , mentre su windows erano salvati con il simbolo "\", questo 
comportava la non portabilita' di una coverage da una macchina windows a una macchina unix.

Da qui la ragione di ricorrere a formati come l' E00 che normalizzavano questi aspetti e rendevano la portabilita' piu' sicura.

Quindi vi e' un altro aspetto da considerare:

formati di lavoro e formati di interscambio.
I primi devono essere pensati per fornire velocita' ed efficienza. Rapidi nello scrivere, aggiornare e rimuovere i dati, e rapidi anche nella ricerca delle 
informazioni.
I secondi, non si devono preoccupare di essere rapidi nell'aggiornamento, e nella gestione, ma devono solo conservare per bene tutto quanto, e garantire 
di portarsi dietro anche una serie di infomrazioni accessorie che consentano di poter ricostruire l'infrastruttura dei files anche su sistemi differenti.

I secondi devono senz'altro essere documentati e le loro specifiche essere diffuse, altrimenti manca un presupposto base per l'interscambio.
I primi , se non sono documentati e' certo un male, ma minore, perche' in fin dei conti non essendo pensati per la portabilita' spesso non consentono proprio 
la loro implementazione in ambienti differenti e con questo costringerebbe chi li volesse usare a tutti i costi a introdurre delle modificazioni che farebbero 
perdere compatibilita'.

Ciao.


On Sat, 3 Nov 2007 10:18:01 +0100, strk wrote:

>On Fri, Nov 02, 2007 at 11:20:07PM +0100, Andrea P. wrote:

>> Infatti il problema non e' la distinzione tra formati proprietari e formati open,
>> perche' una separazione cosi' netta, costringe a mettere dalla parte dei formati proprietari (i cattivi) anche quelli che hanno le specifiche rilasciate e 
usabili (piu' o meno gratuitamente).

>Mi sembra che in questa discussione ci sia un difetto dibase: la mancanza di definizione
>di "formato aperto" e "formato proprietario".
>A mio avviso, se le specifiche sono rilasciate ed usabili questo e' sufficiente perche' si
>possa parlare di formato aperto. Aperto ad essere visto e compreso in tutti i dettaglio.
>Usabile nel poter sviluppare software di conversione verso altri formati.

>Mi viene in mente lo Shapefile della ESRI. E' un formato ben documentato, e di conseguenza
>ci sono molti software in grado di importarlo in altri formati. Non c'e' uno "standard body"
>dietro, ma non importa per quel che riguarda l'apertura e l'usabilita'.

>Da un'altra pare mi viene in mente il formato ShockWaveFlash.
>E' un formato (non ben) documentato, ma la documentazione viene rilasciata con una EULA
>che ne vieta ai lettori lo sviluppo di software che interpreti tale formato.
>Specifiche rilasciate, ma non usabili.

>Un'altro caso ancora e' il formato di un software di mappatura libero in cui sono incappato di recente
>che utilizza un formato "aperto" ma senza specifiche rilasciato (se non il codice stesso).
>Difficile utilizzarlo...

>Poi pensiamo al codice ASCII. Adottato da uno standard body e tutt'ora utilizzato con successo.

>> Nei formati open , poiche' chiunque e' libero di "metterci del suo" , il rischio in queste circostanze e' la "schizofrenia del formato" . Nel senso che si 
assiste a rilasci di nuove versioni che 
>> cambiano quanto previsto nelle precedenti. Versioni hce possono anche essere "eretiche" e quindi non rilasciate dal medesimo gruppo, ma da altri che 
partendo dall'assunto che sono "open" ne elaborano una 
>> nuova versione cercando di superare certi limiti e porsi come evoluzioni spesso in conflfitto con la versione originale.

>Qui parliamo di stabilita' del formato, che e' un passo successivo.
>Ovviamente all'emergere di un nuovo formato c'e' sempre una fase di transizione, di adattamento.
>Ad esempio, io non mi trovo affatto bene con l'ascii esteso (8bit), l'UTF, l'Open Document Format, ...
>E' scomodo dover adattare tutto il proprio software a nuovi formati.
>Mi sono trovato scomodo (in passato) anche con le PNG (il mio browser non le supportava).

>Per fortuna esistono formati aperti e stabili oltre a quelli aperti e non stabili, e quindi
>si puo' scegliere quali usare a seconda delle esigenze.

>> Per cui tendo a credere di piu' in formati dove chi li gestisce tiene in mano la barra del comando e indirizza la nave in una direzione ben precisa.
>> L'idea che dietro a un formato ci possa essere una pletora di mani in cui ognuno tira da una parte diversa non mi renderebbe molto entusiasta nell'usare 
quel formato.

>Sicuro, non basta che un formato sia aperto per adottarlo ad occhi chiusi.
>Ad ogni modo un formato senza specifiche pubbliche o senza legittimita' di interpretazione 
>e' indubbiamente da escludere nel momento in cui si usa per comunicare informazioni
>al pubblico, che e' quello che una PA fa o dovrebbe fare con la sua presenza web.

>Pensa se per leggere la gazzetta ufficiale bisognasse comprare un "decodificatore"...

>Or metti a confronto l'accessibilita di questi formati
>(dai solo un'occhiata alle pagine su l'enciclopedia libera)

>            ASCII:  http://en.wikipedia.org/wiki/ASCII

>        Shapefile:  http://en.wikipedia.org/wiki/Shapefile

>             JPEG:  http://en.wikipedia.org/wiki/JPEG
>                    (vedi anche: Potential patent issues)

>              GML:  http://en.wikipedia.org/wiki/Geography_Markup_Language

>              E00:  http://en.wikipedia.org/wiki/E00
>                    (http://avce00.maptools.org/docs/v7_e00_cover.html)

>              ECW:  http://en.wikipedia.org/wiki/ECW
>                    ( ??? )

>--strk;







More information about the Gfoss mailing list