Skip to content

Chi cerca Trova

Una piccola guida per usare al meglio i motori di ricerca. La guida è stata scritta per aiutare gli utenti nell’uso del motore di ricerca basato su tecnologia Lucene disponibile sulla piattaforma Dekiwiki, con la quale stiamo sperimentando una soluzione Intranet Wiki Based all’interno della Ripartizione III, Affari Patrimoniali.

Molte delle indicazioni sono comunque utilizzabili con tutti i motori di ricerca e servono a dare una panoramica sull’uso più efficace di questa tecnologia.

Cercare e ritrovare le informazioni. questo è il vantaggio maggiore che si percepisce utilizzando un wiki.

La qualità della risposta dipende ovviamente da come si pone la domanda. In questa guida troverete alcune  indicazione per interrogare in maniera più efficace il motore di ricerca e risparmiare tempo.

I fattori più importanti per migliorare la ricerca sono:


  • la classificazione dei documenti

  • La selezione dei termini e delle frasi

  • l’uso dgli operatori logici AND, OR, NOT

  • l’utilizzo dei campi riservati per  raffianre la ricerca

Classificare i documenti

La classificazione dei Documenti è una scenza a parte.  Recentemente lo sviluppo delle tecnologie che vanno sotto il nome di Tagging hanno migliorato e facilitato questo compito. Tag in inglese, significa etichetta ed ormai quasi tutti i conten managemetn system implementano strumenti per classificare i conteuti con etichette liberamente scelte dall’autore del conteuto o strutturate a priori. A parte quelle riservate che servono a garantire certi automatismi (telefonata, cds, annunci, contatti, sett X, ecc…) che possono essere concordate ogni ‘utente è libero ed è invitato ad aggiungere il maggior numero di parole chiave con le quali descrivere il documento creato. Questo facilità la ricerca da parte di altri utenti e la navagazione. I motori di ricerca hanno solitamente delle parole riservate per restringere il campo della ricerca all’indieme delle etichette utilizzate, migliorando tempo di risposta e pertinenza.

Di seguito indichiamo rapidamente gli strunmenti a disposizione dell’utente del motore di ricerca per eseguire ricerche più mirate.

Termini


Una stringa di ricerca (query, ovvero l’insieme di parole utilizzate per la ricerca) è suddivisa in termini ed operatori logici.


Ci sono due tipi di termini: Termini singoli e Frasi.


Un termine singolo è una semplice parola chiave es: “ciao”, “Napoleone”


Una Frase è costituita da un gruppo di termini espressi tra virgolette “Mar dei sargassi”

Più termini possono essere concatenati utilizzando gli operatori logici Boolenani  (AND, OR, NOT…)

Campi riservati


Con il motore di ricerca di patrimonionet si possono fare ricerche filtrando i contenuti in base ad alcuni campi standard. Basta utilizzare la sintassi adeguata <nome del campo>: <termine delle ricerca>


Deki Wiki ha i seguenti campi riservati all’interno dei quali effettuare la ricerca:


  • uri: l’indirizzo completo per la la pagina o il file indicizzato

  • path: il percorso assoluto della pagina  (not disponibile per i file)

  • title: titolo di una pagina o il nome di un file allegato

  • size: la dimensione espressa in bytes di una pagina o di un file allegato

  • type:  il tipo di contenuto indicizzato ( “wiki” per le pagine del wiki, “documents” per i documenti allegati e “images” per le immagini

  • author: il nome dell’ultima persona utente che ha modificato la pagina o il file

  • content: ricerca all’interno dei contenuti e dei file escludendo quindi etichette, commenti e titolo

  • comments: ricerca all’interno dei commenti  collegati ad una pagina

  • tag: recupera tutte le pagine etichettate con il termine della ricerca

  • description: ricerca all’interno delle descrizioni dei file allegati ad una pagina

  • date.edited: ricerca in base alla data dell’ultima modifica della pagina   (il formato è  “YYYYMMDDhhmmss“;
    e.g. “20070801171530” corresponds to 5:15:30pm on August 1st, 2007)

Esempi


Se volete cercare il documento intitolato “Hai visto mai” ceh contiene in testo “l’utile in crescita del 250%” basta introdurre nella casella di ricerca


f you want to find the document entitled “The Right Way” which contains the text “don’t go this way”, you can enter:


title:"Hai visto mai " AND content:250%


Note: la ricerca nel campo vale solo per il termine immediatamente sucessivo ai due punti cosiì se introducioan


title:Gran bella mossa


la ricerca avverrà nel campo titolo solo per la parola “Gran”. Le parole bella e mossa verranno ricercate nel campo di default ovvero nel corpo della pagine

Modificatori di Termini

Lucene supporta la genralizzazione dei termin per offrire un ventaglio maggiore di opzioni di ricerca.

I caratteri Jolly


Lucene permette l’uso di caratteri Jolly, singoli o multipli all’interno di un singolo termine non nelle frasi.


Per sostituire un singolo carattere con un carattere Jolly si usa il simbolo “?”


quindi ricercando la parola


 test?


troverremo i seguenti risultati se conteuti nelle pagine del wiki




  • testa

  • testo

  • testi

  • teste

Per effetturare una ricerca con più caratteri variabili si usa il simbolo “*”


quindi ricercando la parola


 test*


troverremo i seguenti risultati se conteuti nelle pagine del wiki


  • testa

  • testo

  • testi

  • teste

  • testugine

  • testosterone

ecc…

Note: non si possono uisare i caratteri  * or ? come primo carattere di una ricerca

Ricerche Fuzzy
Il motore di ricerca permette di efefttaure anche le cosiddette ricerche Fuzzy basate sull’algoritmo della distanza di Levenshteid o Edit Distance Algorithm.


Per effettuare uan ricerca “Fuzzy” basta aggiungere la tilde “~” alla fine della parola chiave (per scriverre la tilde tenetre premuto ALT+126). Per esempio per cercare un termine simile alla parola Roma utilizzate la ricerca fuzzy


roma~


troverete termini tipo  soma, coma, boma etc…


Ricerche di Prossimità


Lucene permette di ritrovare parole ad una specifica distanza l’una dall’altra. Basta aggiungere alla fine della parola chiave la tilde e la distanza espresa in numero di parole. Ad esempio per cercare “apache” e “jakarta” in uno spazio di 10 parole all’interno di un documento scrivete


"jakarta apache"~10


Ricerche in intervallo


Questo tipo di ricerca permette di trovare documenti in cui i valori di determinati campi (date o tetichette ad esempio) sono compresi tra valori minimi e massimi. I risultati vengono ordinati secondo l’ordine alfabetico per i testi. Ad esempio


mod_date:[20020101 TO 20030101]


restituirà i documenti  modificati  tra il 1° gennaio 2002 e il primo gennario 2003


Gli intervalli possono essere utilizzanti anche per i valori di testo . Y


title:{Aida TO Carmen}


In questo caso ritroveremo tutti i documenti i cui titoli sono compresei tra Aida e Carmen esclusi i due termini.
Se li vegliamo includere basta effettuare la ricerca includendo la sintassi tra parentesi quadre. Se volgiamo cercare tutti i documenti al di fuori dell’intervallo basterà includere la sintassi tra parentesi graffe.


Rafforzare un Termine


Il livello di pertinenza dei risultati del motore di ricerca dipende dalle occorrenze trovate. Per privilegiare un terine rispetto ad un altro dando la precedenza ai docuemnti che lo contengono si puiù usare l’accento circonflesso “^” seguito da un numero che esprime il peso  che volgiamo attribuire al termine. Più alto è il numero maggiore sarà la rilevanza del termine.

Per esempio se volessimo dare maggior peso a al termine “jaarta” rispetto a quello “apache” digitate:

jakarta^4 apache


Si possono potenziare anche intere frasi:


"jakarta apache"^4 "Apache Lucene"


Di default il fattore 1. Il fattore di rilevanza Deve essere comunque  un valore positivo.


Gli Operatori Logici Booleani



Permettono al combinazione dei termini per effettuare delle ricerca maggiornmente puntuali.  Lucen permentte di usare gli operatori AND o “+” e NOT o “-” avendo cura di scriverli con le MAIUSCOLE


L’oeratore OR o disgiuntivo è quello usato di default e permette di ritrovare tutti i documenti nei quali ciascuno dei due termini è presente indipendentemente dalla presenza dell’altro.


per cercare idocumenti che contengono si ala frase  “jakarta apache” o solo la parola  “jakarta” scrivete :


"jakarta apache" jakarta


o


"jakarta apache" OR jakarta

AND


L’operatore AND  permette di trovare i documenti dove entrambe i termini sono presenti.


Per cercare di documenti che contengono entrambe  le frasi  “jakarta apache” and “Apache Lucene” usate la quelry:


"jakarta apache" AND "Apache Lucene"


+


Il simbolo  “+” or operatore “richiesto” fa in modo che il termineche segue esista da qualche aprte nel documento .


Per cercare idocumenti che devono contenere il termine “jakarta” e possono contenere il termine “lucene” sate la query:


+jakarta lucene

NOT


L’operatore NOT esclude i docuemnti che contengono i termi che seguono l’operatore.


Per cercare i documenti che contengono “jakarta apache” ma non “Apache Lucene” usate la query:


"jakarta apache" NOT "Apache Lucene"


Note: TL’operatore not non può essere usato con un solo termine o frase. Per esempio . la seguente ricerca non produrrà risultati


NOT "jakarta apache"


Il simbolo “-” or o operatore di proibizione esclude i documenti che contengono il termine seguente


Per cercare i documenti che devono contenere “jakarta apache” ma non “Apache Lucene” usate la query:


"jakarta apache" -"Apache Lucene"


Raggruppamenti

Lucene Usa le parentesi per raggrupapre termini che formano sub query. Ovvero la ricerca di termini all’interno di un insieme di risultati che dipendono da un un dato termine (padre).  Usato incombianzione con gli operatori booleani questo sistema è utile per controlalre la logica della ricerca

Lucene supports using parentheses to group clauses to form sub queries. This can be very useful if you want to control the boolean logic for a query.

per cercare  le parole  “jakarta” or “apache” and “website” si può usare l’espressione

(jakarta OR apache) AND website

Questo elimina ogni ambiguità e restituirà collegamenti a documenti che contengono sicuramente la parola website e possono contenere sia la parola jakarta che apache.

Escaping Special Characters

Lucene supports escaping special characters that are part of the query syntax. The current list special characters are

+ – && || ! ( ) { } [ ] ^ ” ~ * ? : \To escape these character use the \ before the character.

or example to search for (1+1):2 use the query:

\(1\+1\)\:2

Lascia un commento

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...

%d blogger cliccano Mi Piace per questo: