[Gfoss] Qualita' dei dati e metainformazione - ex [qualità peggiore di quanto mi avevano detto]

Andrea Peri peri.rtoscana a gmail.com
Ven 25 Lug 2008 21:11:12 CEST


Colgo l'occasione del precedente intervento per introdurre un
argomento che penso sia pertinente.
Nella qualita' dei dati non si puo' ignorare il concetto di Metainformazione.

In particolare la metainformazione dei dati geografici secondo lo
standard ISO19115.

In tale standard e' previsto per documentare la qualita' del dato, due
modalita',
la prima (Lineage) prevede di esprimere la qualita del dato tramite la
descrizione delle procedure
compiute per ottenere l'archivio finale partendo da dati sorgente.
La seconda (report) prevede di esprimere la qualita' del dato tramite
delle indicazioni precise di
misurazioni, tolleranze ed errori rilevati.

E' bene chiarire che in queste due grandi famiglie non e' previsto
solo la qualita' del dato intesa
come precisione nei confronit del mondo reale.
Ma anche la qualita' del dato intesa come aderenza a le specifiche nel
senso piu' ampio.
Completezza, topologia, temporalita', etc...

Questa pero' e' una premessa al concetto che volevo introdurre.

Infatti tipicamente si ritiene che questo tipo di metainformazione si
rivolga all'archivio nel suo complesso.

Pero', come sempre piu' spesso avviene,
il dato geografico, visto come archivio, ormai non e' piu' un oggetto
monolitico, in cui si puo' esprimere
la qualita' di un archivio in termini globali, ma e sempre piu' un
sistema multi-composito in cui coesistono dati di provenienza
eterogenea.
In esso ogni feature (o oggetto geografico per semplificare) ha una
sua ben precisa storia.

Cito ad esempio, i dati di OpenStreetMap, non perche' li conosca, ma
perche' e' un buon
esempio di dati di provenienza eterogenea.

Ma potrei altrettanto citare come esempio i dati degli ambiti comunali
della regione Toscana. In cui
ogni singolo tratto di confine e' stato ricavato a seconda del dato
disponibile, o da dato catastale a scale 1:2000 o da ctr 1:2000 o da
ctr 1:10.000.
Ovviamente un arco preso su una ctr 1:2.000 ha una precisione e
aderenza alla realta' superiore rispetto a un dato preso su una scala
1:10.000

Questo modello operativo comporta che e' difficile, per non dire
impossibile esprimere una qualita' dell'archivio, ma bensi'
bisogna esprimere la qualita di un gruppo di features financo alla
qualita' di una singola feature.

Per questo nelle specifiche ISO19115, un po' in disparte per la
verita', ma ben presente, e' prevista l'opzione
per definire una scheda di metainformazione "multi-livello" in cui a
una scheda padre che esprima il dataset si puo' abbinare una scheda
"figlia" che esprima un singol elemento o gruppo di elementi.
E sarebbe una sottoscheda classificata di tipo  "Feature Instance"
(singola istanza di oggetto geografico)
Naturalmente 'e possibile anche farla di tipo "Attribute Instance"
(singola istanza di attributo).
Con cui si puo' documentare anche la qualita' di una singola feature
che e' presente in un archivio.

E tutto, mantenendo il contesto di documentazione di un archivio.

Un esempio o caso di uso potrebbe essere il seguente.

Viene prodotto un archivio con delle specifiche.
Tale archivio potra' avere un determinato livello di qualita' dei suoi dati.
Che si puo' esprimere con la modalit'a lineage o report a seconda
delle situazioni.

Poi, questo archivio nel tempo viene moificato in qualche sua parte.
Ad esempio perche' con un volo ad hoc viene perfezionato un tratto,
oppure perche' viene
aggiunta una strada, rilevata pero' da una foto satellitare.
Queste aggiunte, sono chiaramente a qualit'a differente rispetto a
quella iniziale.
Per cui per esprimere questo concetto, si crea una scheda figlia della
scheda di metainformazione
dell'archivo, si crea di tipo "feature-instance" e su di essa si
esprime i valori qualitativi di tale feature.
Oltre, certamente agli altri elementi che concorronno a fornire la
meta-informazione relativa a questo nuovo
elemento geografico aggiunto all'archivio.

Questo e' uno scenario su come si potrebbe (o dovrebbe ?) operare con
i dati geografici,
ovverosia tenendo sempre allineato il dato e il metadato.
E aggiungendo sempre una feature-instance quando si aggiunge un nuovo
elemento geografico all'archivio.

Purtroppo le necessita' di operare in tempi stretti e il fatto che
spesso chi aggiorna i dati non percepisce
la necessita' di dover subito ri-allineare la metainformazione.
Unito al fatto che attualmente la meta-informazione viene vista come
un elemento globale dell'archivio.
E di conseguenza i sisitemi per meta-informare secondo iso109115,
tendono a trascurare questo aspetto,
per niente secondario che la conoscenza della qualita' di un dato
interessa a livello di singola feature
geografica e non di archivio globale.


Saluti,

Andrea Peri.


-- 
~~~~~~~~~~~~~~~~~
§ Andrea §
§ Peri §
~~~~~~~~~~~~~~~~~


Maggiori informazioni sulla lista Gfoss