[Gfoss] Gentetwork e tracciamento delle schede di metadato sui ragni di ricerca.
aperi2007
aperi2007 a gmail.com
Sab 2 Nov 2013 17:33:25 CET
On 02/11/2013 16:41, Alessandro Sarretta wrote:
>
> Ciao Andrea,posso per curiosità chiederti come mai non vuoi avere le
> singole schede indicizzate?
> Ale
>
Google, non è un sistema di ricerca per metainformazione e il fatto che
ritorni delle schede di metainfo crea confusione.
Le schede di metainfo non esistono realmente , ma sono prodotte da un
sistema dinamico al volo.
Come tali non dovrebbero mai comparire sui risultati di un motore tipo
google.
Questo perche' esse non sono vere e proprie risorse statiche (pagine
html) archiviate su un qualche server web, ma bensi' una risorsa
astratta inesistente perche' generata al volo da un sistema di catalogo.
Nel nostro caso poi vi è il fastidio extra che facendo determinate
ricerche ci compare come primo risultato una nostra scheda di
metainformazione in xml che in realtà poiche' faceva riferimento a un
sistema recentemente dismesso da' pure errore.
Ma tornando al caso piu' generale.
Per fare un esempio concreto:
Come si sa' le schede su GN sono invocabili sia tramite il loro prefisso
univoco contenuto nell'tag FileIdentifier (UUID) che tramite il loro
numero di indice di archiviazione.
PURTROPPO GN ('ritacci sua) presenta i links usando l'indice interno
anziche l' UUID.
Questo ha una conseguenza molto fastidiosa.
Infatti se io in fase di gestione delle schede su GN cancello una o piu'
schede e poi le ricarico, magari delle nuove versioni ricorrette (prassi
abbastanza consueta), l' UUID delle singole schede resta invariato
perche' ovviamente se si fa' le cose per bene si mantiene tale valore
invariato. Come è giusto che sia perche' è cio' che secondo ISO
realmente identifica la scheda per sempre.
Ma l'indice interno che la indicizza sul DB di GN cambia perche' esso
viene preso da un progressivo del DB.
Il risultato è che se oggi la scheda era linkata con
....?id=17
Dopo averla ricaricata la nuova scheda che sostituiva la vecchia (ma che
ne dovrebbe ereditare in tutto e per tutto il ruolo e lo scopo) sara'
linkata con un nuovo indice, ad esempio
...?id=38
MA Google, continua a presentarla sempre con ...id=17 perche' tale è
cio' che si era memorizzato al momento del pasaggio dei suoi ragni.
E quindi quando la presenta, il link di invocazione su GN dara' come
risultato
che la scheda è inesistente
Questo se va bene, se invece va male, puo' addirittura capitare che GN
presenti una altra scheda completamente differente e che non centra niente.
La ragione se ci si pensa bene è sempre legata al fatto che la scheda
xml non è na risorsa statica, ma dinamica.
Per questo sono convinto che è meglio che Google stia fermo e non
presenti schede XML come risultait di ricerche.
Certo anche qui si potrebbe dissertare che se GN presentasse i links
tramite l' UUD del fileidentifier quesot problema non sussiterebbe.
Ma resta il punto che la scheda di MTD è una risorsa dnamica e non
dovrebbe essere proposta come risultato da un motore di ricerca.
Putroppo la soluzione maestra, il tag di "noindex" va a cozzare con l'
XSD della ISO19115 e quindi si bloccano a vicenda.
:(
Andrea.
Maggiori informazioni sulla lista
Gfoss