[Gfoss] formati liberi [era: dati geologici]

strk strk at keybit.net
Sun Nov 4 03:23:19 CET 2007


On Sat, Nov 03, 2007 at 12:53:06PM +0100, Andrea P. wrote:

> Firenze, 03/11/2007
> 
> >Mi sembra che in questa discussione ci sia un difetto dibase: la mancanza di definizione
> >di "formato aperto" e "formato proprietario".
> >A mio avviso, se le specifiche sono rilasciate ed usabili questo e' sufficiente perche' si
> >possa parlare di formato aperto. Aperto ad essere visto e compreso in tutti i dettaglio.
> >Usabile nel poter sviluppare software di conversione verso altri formati.
> 
> >Da un'altra pare mi viene in mente il formato ShockWaveFlash.
> >E' un formato (non ben) documentato, ma la documentazione viene rilasciata con una EULA
> >che ne vieta ai lettori lo sviluppo di software che interpreti tale formato.
> >Specifiche rilasciate, ma non usabili.
> 
> Infatti io non lo userei mai per un mio progetto.
> 
> Pero' nel caso specifico di Flash occorre riconoscergli un deciso merito in quanto ha ricoperto un buco di funzionalita' che per anni ha 
> attanagliato l' html del web.
> 

> Ricordo riunione fin dal 1997 in cui l'ordine del giorno era decidere se usare l' html con quello che ne seguiva in termini di pochezza di grafica o i formati 
> shockwave (che all'epoca mi pare si chiamasse director) 
> 
> Giustamente vi era chi sosteneva che l'html era troppo misero in termini di restituzione grafica e da browser a browser le cose erano intepretate in maniera 
> troppo differente da garantire una stabilita' di riproduzione.

Quello fu un passo falso, molto grave.
Non si era capito (e aihme, ancora non lo capiscono molti) cosa Internet fosse.
In molti lo hanno provato a ricondurre ai mezzi di informazione di massa, applicando
concetti come l'immediabilita' di fruizione, propri della comunicazione unidirezionale
ad un media nuovo, completamente diverso, basato non sull'immediatezza ma
sull'approfondimento, sullo scambio di informazioni reciproche.

Quanto serve la stabilita' di riproduzione ?
La riproducibilita' esatta di un layout, quanto e' importante rispetto all'accessibilita'
delle informazioni che con quel layout si vogliono comunicare ?

Questa confusione mentale e' stata alimentata dal marketing dei compeitors di cui parli sotto.
Netscape aveva un editor WYSIWYG, e cosi' anche M$, con FrontPage :/
What You See Is What You Get.
Quello che vedi e' quello che ottieni.
BUGIA !!

Quello che vedi e' quello che ottieni se usi solo il MIO PRODOTTO.

Una pagina web si puo' scrivere in solo testo.

"io sono una pagina web"

ASCII puro.
Qualche tag per fare i paragrafi ed i titoli e si puo' rendere piu' leggibile.
Facile no ?

"pochezza di grafica" ???
E a cosa si riuncia in nome di una grafica ricca ?
All'accessibilta' dell'informazione !
Avete mai pensato alla possibilita' che un software "legga" per voi il contenuto
dei siti web ? E' facile leggere testo in formato ASCII per un software. Il formato
HTML di base puo' essere molto utile anche per interpretare meglio il contenuto.
E' il contenuto che va strutturato, non la presentazione.

Credo tu sappia che il formato XML non serve ad altro che a strutturare il contenuto.
L'HTML l'ho imparato guardandolo, e' leggibile !
Quello scritto a mano, non quello scritto dagli editor WYSIWYG.
You know what you get ? A jail !
Un groviglio di cose incomprensibili che ti rendono dipendente dall'editor HTML.
XML, come HTML, dovrebbe essere una cosa leggibile, e documentabile, e validabile.
Credo che lo sia.
Ecco, ad esempio qualcuno ha pensato di usare un formato XML per i dati geografici.
Cosi' li puoi leggere con qualunque visualizzatore di caratteri ASCII (chi puo' non
averne ?). Si possono pure stampare, se hai abbastanza carta.

> Tieni presente che all'epoca vi era netscape 0.9 come unico browser gratuito, ancora IE non era neanche uscito.

Netscape non era l'unico, c'era (e c'e' tutt'ora) il browser testuale lynx.
Prima di netscape c'era NCSA.

> Quando poi usci' IE comincio' la famosa guerra dei browsers che porto' tutti i competitors a rilasciare nuove evoluzioni assolutamente non standards nei tags 
> html. Con la speranza di riuscire a stroncare l'avversario.
> 
> Ad esempio , le specifiche per i frame non erano parte integrante dell' html, ma furono una invenzione fatta da Netscape, che poi solo con il rilascio delle 
> specifiche 3, furono adottate dal Cern in maniera ufficiale.

Ok, ma questa guerra e' stata combattuta usando tutti noi come soldatini.
Persone sedute a fare riunioni su come ottenere una stabilita' di presentazione.
Uno dei primi libri sull'XML cominciava con questa citazione:

	"La internet e' rovinata. E l'ho rovinata io."

Rovinata *usando* tag non-standard, piu' o meno consapevolmente (dai poveri fregati dal software
proprietario abituati a subire, agli aitanti espositori di bottoni "best viewed with XXY").

> Qui mi ricollego al discorso che solo con delle specifiche stabili si riesce a compicciare qualcosa di credibile, durante la guerra dei browsers si assisteva a un 
> fiorire di pagine html che di volta in volta serviva o netscape o IE per poter vedere, e spesso bisognava disporre di piu' versioni del medesimo browsers, 
> perche' da una versione all'altra cambiavano le regole di interpretazione dei tags.
> L'unico che teneva dritta la barra e garantiva una buona compatibilita' (anche se non eccezionale ) era proprio shockwave. Con esso cascavi sempre in 
> piedi.

Che vuol dire "dritta la barra" ? Una metafora fallica ?
Con shockwave ne ha sofferto di gente. 
La credibilita' sta nel modo in cui ci si rapporta agli altri, nella coerenza, nel
credere in quel che si fa, nel non discriminare gli utenti di un servizio, ad esempio.
La giacca e la cravatta sono feticci del passato.


> Poi, con  il passare del tempo il formato si e' affinato e specializzato. Pensa che permette persino di soddisfare le specifiche sull'accessibilita' , riuscendo a 
> pilotare screen-readers e riproduttori sonori.

Pensa un po' che leccapiedi. Pur di piazzartisi a fianco ti farebbe anche il caffe'...
Ma visto che e' tanto bravo, perche' non ci insegna a pilotarli gli screen-reader ?
Ma sai che nel 97 gli screen-reader leggevano tranquillamente l'HTML ?

> Per cui bisogna ammettere che il suo primato se lo e' conquistato sul campo, quando la ditta vi ha creduto e lo ha supportato e spinto anche contro giganti 
> del calibro di Microsoft. In quanto rilasciare un nuovo plugin per tutte le piattaforme netscape, IE , ogni volta che usciva una nuova versione di browser, o di 
> sistema operativo era senz'altro un impegno non indifferente.

Che primato si e' conquistato ? Del new-marketing ?

> Dopo di che' il fatto che la ditta che lo detiene lo consideri un bene della societa' e ne tenga stretto i diritti di sfruttamento, e' una scelta aziendale loro. Che 
> solo il tempo potra' dire se e' giusta o sbagliata.

Se ti riferisci alla "stabilita'" del formato ti preannuncio che la considererai
giusta. Il GNU Flash Player (gnash) gia' introduce incompatibilita', quindi tornerete
a dovervi trovare con piu' flash player sul desktop se volete che il contenuto che
distribuite sia "presentabile".

Di chi e' la colpa ?
Forse nel fatto che le specifiche sull'interpretazione del formato siano accompagnate
da una licenza che ne vieta l'uso ?

Il succo e': meglio serviti tutti da un unico fornitore o poter scegliere il fornitore
in base alla qualita' del servizio che offre ? Tutt'oggi vendono machine per il caffe'
da ufficio che funzionano SOLO con le cialde specifiche di quella marca (manco a dirlo,
la macchina costa poco, le cialde moltissimo).
In questo caso la macchina (i generatori di filmati flash) si trova anche gratuitamente !

> La nuova generazione dei formati di cui l'ecw e il sid sono stati antesignani sono di livello senz'altro superiore.
> Io penso che ora come ora il formato migliore sia il jpeg2000.
> Pero' ancora i browser non mi risulta che lo supportino in maniera adeguata. 
> E poi un annetto fa' ancora rilevavo alcuni problemini di compatibilita' nella portabilita' del formato JP2K tra viewers diversi .
> Non so' se la situazione oggi e' migliorata.

Problemi di brevetto:
http://en.wikipedia.org/wiki/JPEG2000#Legal_issues

Ma, scusa l'ignoranza, a cosa servono questi formati ?
Non c'e' un formato aperto utilizzabile per distribuire questi dati ?
Se non c'e', non basta scriverne una descrizione perche' ci sia ?
I dati topologici di tutti gli stati uniti sono distribuiti in un formato definito dal censous bureau
(credo la loro versione del nostro ISTAT?)

 http://www.census.gov/geo/www/tiger/

Interessante leggere la nota sulla fine dell'uso di questo formato legacy per usare invece
nelle nuove versioni un formato Shapefile (aperto, sebbene senza uno standard body dietro).

 The Future of TIGER/Line - http://www.census.gov/geo/www/tiger/future/future_tl.html

Anche molto interessante visitare il primo sito che torna da google quando si cerca "tiger data".
Mostra chiaramente quanto personaggi con poca capacita' di "presentazione" riescano tuttavia
ad usufruire in maniera diretta di quei dati, indicando la provenienza e la licenza con cui
sono distribuiti, e linkando alla fonte:

 http://www.gpss.tripoduk.com/tiger.htm

> >Sicuro, non basta che un formato sia aperto per adottarlo ad occhi chiusi.
> >Ad ogni modo un formato senza specifiche pubbliche o senza legittimita' di interpretazione 
> >e' indubbiamente da escludere nel momento in cui si usa per comunicare informazioni
> >al pubblico, che e' quello che una PA fa o dovrebbe fare con la sua presenza web.
> 
> >Pensa se per leggere la gazzetta ufficiale bisognasse comprare un "decodificatore"...
> 
> non sono sicuro di aver capito completamente il discorso.
> 
> Infatti, devi tener presente che comunque la lingua italiana devi riuscire a leggerla per poter comprendere le informazioni contenute nella GU.
> Diverso e' per l' EU che pubblica i suoi documenti in piu' lingue. In italia se non conosci l'italiano devi difatto comprare un "decodificatore" (poi cosa sia tale 
> decodificatore e' un dettaglio) per leggerti la GU.

Il decodificatere per l'italiano ce lo insegnano alla scuola elementare.
E per fortuna non infrangiamo nessun diritto intellettuale usandolo.
(forse Manzoni e' stato un fesso a non fare un salto all'ufficio brevetti eh ?)

> Se invece ti riferisci a delle eventuali versioni in formato digitale differenti tra loro. 
> Anche in questo caso il discorso e' parziale.
> 
> Cito il caso del USGS americano che anziche' adottare uno standard esistente ha preferito farsi il suo e poi rilasciare un viewer e delle specifiche di tale 
> formato.
> 
> Ipotizziamo per un attimo che avvenga lo stesso per la GU.
> Se i documenti digitali venissero rilasciati con un formato digitale assolutamente criptico, ma intelleggibile da uno specifico viewer scaricabile dal sito 
> apposito gratuitamente (ma closed source), e disponibile per le piu' svariate piattaforme. Il tuo assunto verrebbe rispettato.

Scusa, non ho capito di quale assunto parli.

> Quando ESRI tiro' fuori dl cilindro ArcGIS, che conteneva al suo interno Arcinfo Workstation e comunque gia' con ArcGIS si poteva gestire le coverages, 
> una cosetta che sostanzialmente era ignorata ai piu' e' che non vi era assolutamente compatibilita' tra una coverages elaborata da un arcinfo workstation 
> su una macchina unix e una coverages scritta con arcinfo workstation su una macchina windows.
> E questo per una ragione banalissima, su unix i percorsi erano salvati con il simbolo "/" , mentre su windows erano salvati con il simbolo "\", questo 
> comportava la non portabilita' di una coverage da una macchina windows a una macchina unix.
> 
> Da qui la ragione di ricorrere a formati come l' E00 che normalizzavano questi aspetti e rendevano la portabilita' piu' sicura.

Se la storia dei percorsi e' vera, sarebbe bastato rendere il lettore *un tantino* piu' intelligente.
Comunque, ben venga un'altro formato (e la stabilita'?).
Dove sono le specifiche ?
Non che le abbia cercate molto (mi fido molto di wikipedia) ma non le ho trovate.

Lorenzo, si era piu' messa su quella pagina sui formati GIS ?

> Quindi vi e' un altro aspetto da considerare:
> 
> formati di lavoro e formati di interscambio.

Daccordo.

> I primi devono essere pensati per fornire velocita' ed efficienza. Rapidi nello scrivere, aggiornare e rimuovere i dati, e rapidi anche nella ricerca delle 
> informazioni.
> I secondi, non si devono preoccupare di essere rapidi nell'aggiornamento, e nella gestione, ma devono solo conservare per bene tutto quanto, e garantire 
> di portarsi dietro anche una serie di infomrazioni accessorie che consentano di poter ricostruire l'infrastruttura dei files anche su sistemi differenti.
> 
> I secondi devono senz'altro essere documentati e le loro specifiche essere diffuse, altrimenti manca un presupposto base per l'interscambio.

Ineccepibile. E se si pubblicano dati su un sito web e' per l'interscambio no ?

> I primi , se non sono documentati e' certo un male, ma minore, perche' in fin dei conti non essendo pensati per la portabilita' spesso non consentono proprio 
> la loro implementazione in ambienti differenti e con questo costringerebbe chi li volesse usare a tutti i costi a introdurre delle modificazioni che farebbero 
> perdere compatibilita'.

Non c'e' modo per un formato di non consentire la propria implementazione in ambienti differenti.
Se non ricorrendo a leggi sulla proprieta' delle idee o facendo il possibile per tenere segreto il formato.

Non c'e' nessuna necessita' tecnica di introdurre delle modificazioni in un formato per implementarne
degli interpreti/generatori in altri ambienti. L'unico motivo per cui si introducono modificazioni
e' la mancanza di una specifica cui fare riferimento, o una cattiva fede ed un marketing spietato.

--strk;


--strk;



More information about the Gfoss mailing list