[Gfoss] Strategia sui metadati per avere delle ricerche efficaci su GeoNetwork

Sab 26 Ott 2013 14:46:33 CEST

Salve,

chiedo scusa per questo intervento OT rispetto alle finaltia' di gfoss, ma
poiche' la ML è visitata da svariate persone che hanno una notevole
competenza sui metadati e in particolare su GeoNetwork mi piacerebbe avere
un feedback su una questione che immagino sia un problema comune per chi
usa geonetwork per gestire i metadati.

Il problema è come strutturare il sistema di schede su geonetwork affinche'
le ricerche di un utente generico non si disperdano in migliaia di rivoli.

Mi spiego meglio:

nelle nostre schede di metainformazione, noi spesso ci troviamo a impostare
una scheda di livello serie che poi viene imparentata con tante schede di
livello dataset e volte pure con un terzo livello di tipo istanza.

Quello che a noi interesserebbe è una situazione per cui un utente che
digita una ricerca, riceva come risultato della ricerca non tutte le schede
nel sistema, che ottemperano a tale filtro di ricerca, ma solamente i
livelli superiori.

Per cui se una scheda dataset corrisponde a tale filtro, ma ha una serie
come padre, nel rissultato dovrebbe comparire la scheda di livello serie.

Puo' sembrare una richiesta assurda, ma non lo è nel mo eto in cui le
proporzioni sono che a 1 scheda serie corrispondeono a volte parecchie
decina , anxhe centinaia di schede dataset e poi anche migliaia di schede
di istanza.

Quello che si vuole evitare è che a fronte di una ricerca che ragionando in
termini di datasets darebbe come risultato un unico dataset, dal punto di
vista del catalogo (geonetwork) dia invece migliaia di risultati,
cosa che per un utente che non conosce il dataset sarebbe disorientante.

Ovviamente una soluzione sarebbe intervenire sul codice di geonetwork e
implementre nuovo codice che faccia le cose come descritto, ma la scommessa
che vorrei perseguire è di farlo impstando in maniera oppurtuna le schede
di metadato ma ricorrendo sempre al solito GN in versione "core".

Ad esmepio avevo valutato l'ipotesi di inserire nelle schede delle keywords
specifiche, ad esmepio una keyword "serie" che permettesse di restringere
la ricerca solo alle schede serie, ma tale soluzione contravviene a una
specifica ISO della scheda stessa, la quale richiede che le keywords siano
provenienti sempre da un tesauro. e questa ovviamente non lo sarebbe.

Una altra soluzione che ho studiato è quella di definire su GN (visto che
le implementa) delle specifiche categorie .
Raggruppando quijdi i datasets (e di conseguenza le schede di metadato) in
specifiche categorie, in maniera da restringere.

Questa soluzione funzionerebbe , ma non risolverebbe il problema di avere
migliaia di risultati visto che se un livello serie va in una categoria,
nella mecedima ovviamente ci andrebbe anche i livelli datasets e istanze.

Una terza soluzione che sulle prime pareva funzizonare era quella di
ricorrere sempre alle categorie, ma usando questa volta tre specifiche
categorie che identificassero la corrispondenza gerarchica assoluta della
scheda che vi appartiene.
Queste tre categorie le avrei chiamate:
serie / dataset /istanze.

cosicche' se un utente cerca i livelli serie ottiene il risultato
restringendo le ricerche solo alla corrispondrnte categoria.

Questa soluzione che pareva buona, ha rivelato pero' un punto debole,
infatti , funzionava se tutte le schede di metadato di tutti i datasets
geografici fossero sempre composte di una scheda di livello serie e una o
piu' di livello datasets.

A meno che non ammetta che nella categoria serie ci posso inserire anche le
schede di metadato di livello dataset che pero' non hanno una scheda padre.

In questo caso pero' si traterebbe di definire non piu' tre categorie
chiamate  "serie/dataset/istanze",

ma piuttosto due categorie:
una che contenga le schede che informano dei dataset nel loro insieme (e
una che contiene le altre schede, in maniera che si vada a restringere i
risultati solamente a quelli significativi.

MI farebbe piacere avere un parere su questa strategia, se ne esistono
altre piu' efficaci e anche come potrei eventualmente chiamare queste due
categorie destinate a contenere appunto le schede di base dei singoli
datasets.

Grazie e scusate per il disturbo,

Andrea

-- 
-----------------
Andrea Peri
. . . . . . . . .
qwerty àèìòù
-----------------
-------------- parte successiva --------------
Un allegato HTML ? stato rimosso...
URL: <http://lists.gfoss.it/pipermail/gfoss/attachments/20131026/2057e71d/attachment.html>