[Gfoss] Gentetwork e tracciamento delle schede di metadato sui ragni di ricerca.

aperi2007 aperi2007 a gmail.com
Sab 2 Nov 2013 17:33:25 CET


On 02/11/2013 16:41, Alessandro Sarretta wrote:
>
> Ciao Andrea,posso per curiosità chiederti come mai non vuoi avere le 
> singole schede indicizzate?
> Ale
>

Google, non è un sistema di ricerca per metainformazione e il fatto che 
ritorni delle schede di metainfo crea confusione.
Le schede di metainfo non esistono realmente , ma sono prodotte da un 
sistema dinamico al volo.
Come tali non dovrebbero mai comparire sui risultati di un motore tipo 
google.
Questo perche' esse non sono vere e proprie risorse statiche (pagine 
html) archiviate su un qualche server web, ma bensi' una risorsa 
astratta inesistente perche' generata al volo da un sistema di catalogo.

Nel nostro caso poi vi è il fastidio extra che facendo determinate 
ricerche ci compare come primo risultato una nostra scheda di 
metainformazione in xml che in realtà poiche' faceva riferimento a un 
sistema recentemente dismesso da' pure errore.

Ma tornando al caso piu' generale.
Per fare un esempio concreto:

Come si sa' le schede su GN sono invocabili sia tramite il loro prefisso 
univoco contenuto nell'tag FileIdentifier (UUID) che tramite il loro 
numero di indice di archiviazione.

PURTROPPO GN ('ritacci sua) presenta i links usando l'indice interno 
anziche l' UUID.

Questo ha una conseguenza molto fastidiosa.
Infatti se io in fase di gestione delle schede su GN cancello una o piu' 
schede e poi le ricarico, magari delle nuove versioni ricorrette (prassi 
abbastanza consueta), l' UUID delle singole schede resta invariato 
perche' ovviamente se si fa' le cose per bene si mantiene tale valore 
invariato. Come è giusto che sia perche' è cio' che secondo ISO 
realmente identifica la scheda per sempre.

Ma l'indice interno che la indicizza sul DB di GN cambia perche' esso 
viene preso da un progressivo del DB.

Il risultato è che se oggi la scheda era linkata con

  ....?id=17

Dopo averla ricaricata la nuova scheda che sostituiva la vecchia (ma che 
ne dovrebbe ereditare in tutto e per tutto il ruolo e lo scopo) sara' 
linkata con un nuovo indice, ad esempio
...?id=38

MA Google, continua a presentarla sempre con  ...id=17 perche' tale è 
cio' che si era memorizzato al momento del pasaggio dei suoi ragni.
E quindi quando la presenta, il link di invocazione su GN dara' come 
risultato
che la scheda è inesistente

Questo se va bene, se invece va male, puo' addirittura capitare che GN 
presenti una altra scheda completamente differente e che non centra niente.

La ragione se ci si pensa bene è sempre legata al fatto che la scheda 
xml non è na risorsa statica, ma dinamica.
Per questo sono convinto che è meglio che Google stia fermo e non 
presenti schede XML come risultait di ricerche.

Certo anche qui si potrebbe dissertare che se GN presentasse i links 
tramite l' UUD del fileidentifier quesot problema non sussiterebbe.
Ma resta il punto che la scheda di MTD è una risorsa dnamica e non 
dovrebbe essere proposta come risultato da un motore di ricerca.
Putroppo la soluzione maestra, il tag di "noindex" va a cozzare con l' 
XSD della ISO19115 e quindi si bloccano a vicenda.

:(

Andrea.




Maggiori informazioni sulla lista Gfoss