Skip to content

Famolo semplice 10

28 agosto 2009

Chi cerca trova. Chi non si è mai sentito ripetere questo adagio dalla mamma?. Bene. Ricordiamocelo allora in sede di progettazione dei siti. Troppo spesso nella progettazione di applicazioni web tralasciamo quello che a guardare bene è lo strumento principe del web: il motore di ricerca.

Quando ci troviamo di fronte all’organizzazione di masse di contenuti la tecnologia dei search engine è senz’altro lo strumento più efficace per facilitare gli utenti nel loro compito. Purtroppo I progettisti, gli amministratori del sito non indicizzano i contenuti, gli “editors” sono avari nel classificarlo e gli utenti finiscono per ignorare la casella “Cerca”.

Se il risultato della domanda non è pertinente, presto l’utente si convincerà, non a torto,  che sul nostro sito, del motore di ricerca non ci si può fidare e quindi non lo interrogherà più.

Al contrario curare i dettagli dell’indicizzazione e porre molta enfasi sull’uso del motore interno aiuterebbe tutti gli utenti a costruire un sito efficace ed efficente.

Purtroppo non sempre le piattaforme di content management offrono un motore di ricerca interno di qualità e se in sede di progettazione e scelta della piattaforma  non si fa attenzione questo apsetto tornare indietro spesso è troppo oneroso.

Contemporanemente chi progetta il sito deve pensare anche alla “formazione” degli utenti e spiegare loro l’uso corretto ed efficace di un motore di ricerca.

Ci sono alcuni piccoli accorgimenti come l’uso degli operatori booleani And, or, spesso sostituiti da simboli algebrici come “+” & o “-“, l’uso degli apici per cercare un’intera frase o l’uso di parole riservate che aiutano a raffinare la ricerca ed ottenere risultati pertinenti in maniera rapida.

Per dimostrare l’importanza della tecnologia di ricerca facciamo un piccolo test.
Mettiamo il caso io stia cercando informazioni riguardo l’ufficio Patrimonio della Sapienza.

vado sul sito http://www.uniroma1.it e cerco inserendo la parola “patrimonio” nella casella.

il risultato lo potete vedere qui. http://www.uniroma1.it/se/search.php?query=Patrimonio&x=0&y=0&search=1

I primi 5 risultati sono ben poco rilevanti

* 1. [100.00%] Università degli Studi di Roma – La Sapienza : Ateneo : Consiglio d…
Il sito dell
http://www.uniroma1.it/collegio/info/linterdip.htm – 13.3kb
* 2. [24.56%] Sapienza – Congresso nazionale Aica
caratterizzata da un patrimonio storico unico al mondo. L’evento vede la collaborazione, oltre che della Sapienza, anche del ministero per i Beni e le attività culturali, riconoscendo l’importanza centrale della
http://www.uniroma1.it/eventi/primopiano/090720_aica.php – 6.0kb
* 3. [24.56%] Sapienza > La colonia felina della Sapienza
Ufficio Valorizzazione Patrimonio Per sponsorizzazioni Telefoni (+39) 06 4991 0524 (+39) 06 4991 0748 (+39) 06 4991 0198 La Sapienza accoglierà con favore il
http://www.uniroma1.it/organizzazione/gatti/sponsor.php – 6.1kb
* 4. [24.56%] Sapienza > Scuole di specializzazione
Area tutela, gestione e patrimonio culturale Area psicologica Area odontoiatrica Professioni legali Dottorati di ricerca Alta formazione Tasse Informazioni Sportello per i diritti delle persone disabili
http://www.uniroma1.it/studenti/scuole/scuole.php?cod_tipo=PC – 7.9kb
* 5. [24.56%] Sapienza > Scuole di specializzazione
Area tutela, gestione e patrimonio culturale Area psicologica Area odontoiatrica Professioni legali Dottorati di ricerca Alta formazione Tasse Informazioni Sportello per i diritti delle persone disabili
http://www.uniroma1.it/studenti/scuole/default.php – 12.6kb

Proviamo ora con Google che, a saperlo usare, permette la ricerca all’interno di uno specifico dominio (uniroma1.it)

basta inserire la seguente stringa su Google:  patrimonio site:www.uniroma1.it

i risultati eccoli qui: http://www.google.it/#hl=it&source=hp&fkt=6004&fsdt=14323&q=patrimonio+site%3Awww.uniroma1.it&btnG=Cerca+con+Google&meta=&aq=f&oq=patrimonio+site%3Awww.uniroma1.it&fp=51c37c2295bfba88

Al primo posto, Google indicizza la Pagina della III Ripartizione Affari Patrimoniali Settore Secondo Gestione Affari PAtrimoniali. Pagina che il motore interno del sito della Sapienza semplicemente non indicizza.
Non male non c’è che dire.

Se provate con la parola Economia, su google la pagina con le indicazioni sulla Facoltà di Economia Arriva al 9 Posto sul motore del sito de la Sapienza non c’è.

A guardare con occhio ancora più attento si nota che i risultatiche fornisce il motore di ricerca interno del sito de La Sapienza privilegiano le pagine che arrivano dalla sezione del Collegio dei Direttori di Dipartimento, questo probabilmente perchè sono quelle aggiornate più di frequente e con un numero magiore di occorrenza della parole più comunmente ricercate.

In conclusione in sede di progettazione bisognerebbe:

scegliere una adeguata tecnologia per il motore di ricerca

configurararla per la corretta indicizzazione

formare gli utenti nell’uso dei motori di ricerca

porre l’atenzione nella produzione dei contenuti agli aspetti rilevanti per una corretta indicizzazione dei documenti. La classificazione. (Sulla classificazione scriveremo unadeguato post.

Intanto è bene sapere che la tecnologia di google è alla protata di tutti. Acquistare una Google Search Appliance costa poche migliaia di euro ma se si pensa al tempo risparmiato da impiegati ed untenti in genere nel reperire informazioni pernso che il’investimenti si possa ripagare in pochissimo tempo .

Una valida alternativa open source e relativamente semplice da implementare è il motore di ricerca SOLR sviluppato dalla Apache Foundation e che usa le API Lucene come motore.

Lucene.apache.org che è a disposizione su tutti i CMS (Content Management System) open source ed è una soluzione efficacissima.

Per avere un’dea sulle potenzialità dell’uso corretto dei motori di ricerca val la pena leggere la guida di Google.

Nella Sezione Saggi di questo Blog c’è una mini guida sull’uso dei motori di ricerca frutto di una esperienza fatta sulla Piattaforma DekiWiki.

6 commenti
  1. fcarnera permalink
    28 agosto 2009 1:24 pm

    Consultando il nostro motore di ricerca cooperativo di google che indicizza una 80ina di siti (tutto il dominio di uniroma1, forum e siti di studenti, blog, eccetera) “PAtrimonio” è il terzo risultato!

  2. Greg permalink
    5 settembre 2009 9:07 am

    Ma la parola chiave “patrimonio” associata al tuo ufficio è rilevante per chi? Perchè escludi che per qualcuno non è più importante trovare la scuola di specializzazione in Area tutela, gestione e patrimonio culturale o il Congresso nazionale Aica? Non confondiamo la reperibilità di un’informazione (problema sicuramente presente nel sito della Sapienza) con la rilevanza semantica (e raggiungibilità) dell’informazioni.

  3. 5 settembre 2009 11:45 am

    è rilevante per tutti quelli come aziende che devono partecipare a bandi di gara ad esempio, ai numerosi soggetti che sono coinvolti nella valorizzazione del patrimonio ecc… Il problema non sta nel fatto di arrivare primi ma che nei primi risltati e nella prima pagina non ci si arriva proprio . Il motore quindi dovrebbe presentare i risultati con le pagine che possono articolare i diversi risultati in base alla variabilità semantica.
    C’è da considerare il fatto che poi la chiave di ricerca di uno studente che cerca la scuola di specializzazione è probabilmente più complessa della seplice parola patrimonio e con tutta probabilità associa ail termine “scuola di specializzazione” raffinando la query. stessa cosa vale per Aica, mentre l’ufficio Patrimonio che nella suddivisione amministrativa corrisponde alla III Ripartizione è senz’altro meno nota come denominazione se non al personale interno. Quello che volevo evidenziare come post è appunto che in sede progettuale la cura del motore di ricerca dell’indicizzazione dei documenti ed il loro dominio semantico andrebbero valutati con molta più cura rispetto a quanto avviene oggi.

  4. websapienza permalink*
    5 settembre 2009 3:24 pm

    Segnaliamo che il motore di ricerca della Sapienza è stato fatto con Sphider

Trackbacks

  1. Un sistema di ricerca per la Sapienza « Web Sapienza
  2. Le funzioni di ricerca renderanno inutili i siti? « Websapienza blog

I commenti sono chiusi.

%d blogger cliccano Mi Piace per questo: