Skip to content

Aggregare Notizie – News Mastering

27 novembre 2009

yahoo pipes logoLa potenza della rete sta nella enorme mole di contenuti che produce ogni giorno. Trovare e aggregare notizie è una caratteristica chiave.  Cos’altro è google news se non un aggregatore delle migliori fonti di news disponibili.

Per una organizzazione estesa come la Sapienza, la possibilità di aggregare contenuti, istituzionali e generati dagli utenti è strategica.  Ci sono strumenti gratutiti e potenti a disposizione dei web master per scandagliare, filtrare e aggregare i contenuti in rete in maniera da fornire un servizi di informazione completissimi.

Yahoo Pipes è tra i più strabilianti.  Ripubblico una recensione che ho fatto qualche tempo fa.

Cosa è Yahoo Pipes

Secondo Tim O’Reilly addirittura:

is a milestone in the history of the internet.

Una pietra miliare nella storia di Internet. Forse è troppo ma di sicuro Pipes è un passo avanti notevole nella direzione della semplificazione dei servizi web e della interoperabilità.

E’ un servizio web con un’interfaccia grafica sofisticata che permette, agli utenti senza particolari conoscenze di programmazione, di assemblare web services abbastanza complessi.

Si possono prendere dati da fonti aperte, pubblicate attraverso i formati di RSS (Really Simple Syndication) o accessibili attraverso API (Application Programming Interfaces) , manipolarle ed aggregarle usando operatori logici, funzioni per filtrare i contenuti, concatenare stringhe, estrarre informazioni utili per la georeferenziazione, introdurre informazioni da parte degli utenti.

Il risultato è un servizio web personalizzato, disponibile in formato RSS utile per essere integrato nelle proprie applicazioni web.

Un esempio.

Si possono prendere le notizie pubblicate su un quotidiano on line, filtrarne i contenuti ed associale con le fotografie che su flickr sono state classificate con le stesse parole chiave fornite da una funzione di Pipes per analisi testuale che le estrae dai contenuti selezionati.

Questo esempio prende alcune parole chiave delle notizie del New York Times e le associa alle fotografie di Flickr.

http://pipes.yahoo.com/pipes/pipe.info?_id=vvW1cD212xGMiR9aqu5lkA

tutto in maniera automatica.

Un’altra applicazione per cui Yahoo Pipes è particolarmente utile è il news mastering. Selezionare diverse fonti filtrarle e fonderle in un unico feed è semplice e permette di immetere nelle proprie applicazioni on line notizie di qualità mantenedo un certo grado di controllo e di coerenza con la propria linea editoriale. Pipes può essere usato come utlile strumento in combinazione con altri servizi per il news mastering come MySyndicaat. Con MySyndicaat per creare il codice html o php da inserire nel proprio sito per mostrare la propria selezione di notizie. Il rislutato si sarebbe potuto raggiungere anche con il solo MySyndacaat ma per ogni parola chiave è necesario inserie i feed di tutte le fonti utlizzate. Con Yahoo Pipes invece queste sono selezionate solo la prima volta e poi basta inserire la parola chiave per avere l’output.
In generale Yahoo Pipes è un utile struemnto per assemblare gli output di tutti i servizi Web che vengono distribuiti in formato RSS feed o con API.
Il limite è la fantasia

La comunità di sviluppo si trasforma in social network

Pipe unisce un sofisticato ambiente grafico solitamente dedicato alla programmazione (assomiglia alle interfacce visuali per la programmazione ad oggetti e ai database relazionali) e lo consegna ad una rete di utenti più estesa. La comunità di sviluppo di trasforma in social network accogliendo anche quegli utenti che non hanno una conoscenza dei linguaggi di programmazione.

Una volta creato un “Pipe” infatti lo si può pubblicare e gli altri utenti lo possono clonare modificare o utilizzare per costruirci sopra altri servizi. Un pò come usare i lego.

Il concetto di “Pipeline” è derivato dal mondo Unix. Nel sistema operativo più famoso del mondo come nei suoi figli (Linux) è possibile convogliare l’output di diverse applicazioni direttamente in altre applicazioni del sistema, costruendo comandi complessi (chiamati appunto Pipelines) e automatizzando compiti complessi.

La stessa cosa fa Yahoo Pipes utilizzando i web services invece delle applicazioni.
Il social network per lo sviluppo ed il test di servizi web

Semplicità d’uso e condivisione quindi sono i punti di forza per questo servizio che promette di dare una bella accelerazione al già prolifico fiorire di servizi Web 2.0. Dal punto di vista dello sviluppo e del successo del servizio proprio l’approccio “social” è l’aspetto più rilevante di questo esperimento di Yahoo.

Invece di percorrere la strada del modello di sviluppo Open Source con una “centrale” per lo sviluppo e per il rilascio di aggiornamenti, patch e documentazione che solitamente porta ad una serie di progetti clone o poco differenti (forking) seguendo gli umori della comunità di sviluppo, Yahoo ha optato per un approccio “embracing failure”. In parole povere cercando di esternalizzare ridurre i costi del fallimento di una idea (traducendo come meglio possibile, costs of failure).

La forza dei progetti open source e quella maggiore delle idee prodotte e realizzate dai social networks risiede proprio in questa capacità. Le imprese hanno costi strutturati, anche la sola progettazione e scelta di diverse strategie di sviluppo comportano dei costi e dei tempi di approccio al mercato. I risultati di servizi come in presenza di servizi flessibili e con un livello di astrazione elevato come Yahoo Pipes i costi di sperimentazioni di tutte le possibili combinazioni che portano ad un prodotto o servizio di successo sono elevati.

Lasciare alla rete la possibilità di combinare e ricombinare gli elementi che lo costituiscono è senza dubbio la migliore strategia. Per gli individui che partecipano volontariamente al social network questi costi sono molto più ridotti per non dire nulli: il loro obiettivo non è il successo del prodotto ma la sperimentazione, l’apprendimento ed eventualmente lo sfruttamento di una idea vincente o un servizio attraente per il mercato.

Diciamo che in questo senso lo scambio di mercato in questione è infrastruttura e tecnologia a disposizione dal lato di chi offre la piattaforma, lavoro, creatività ed esperienza dal lato di chi partecipa al progetto. Un terreno nuovo di scambio di mercato il cui valore è difficile da misurare usando esclusivamente il parametro monetario.

Uno schema comunque funzionante ed in certi casi dalla forza prodigiosa e capace di creare innovazione.

La differenza sta nel numero di persone che Yahoo Pipes rischia di riuscire a coinvolgere in una attività solitamente ristretta ai cosiddetti geek, un numero più esteso di persone. L’esperienza in programmazione richiesta è limitata quello che serve è fantasia e logica (la famosa business logic delle architetture 3 tier).

Dietro l’interfaccia:

Dal punto di vista tecnico il servizio non è altrettanto innovativo. Strumenti per il mash up di dati ce ne sono diversi ma richiedono competenze da programmatore. Vediamone alcuni:

  • Plagger: un “dirottatore” di Rss feed opensource creato da Tatsuhiko Miyagawa che permette di fare più o meno tutte le stese cose che fa pipes ma senza avere l’interfaccia grafica.
  • My Syndicaat: il miglior sistema per aggregare diversi feed e creare un servizio personalizzato Si possono filtrare i feed, eliminare i duplicati, scegliere un lay-out per l’integrazione e diverse tecnologie di scripting;
  • Dapper: The Data Mapper, è un servizio che permette di raccogliere (grab) dati da tutti i siti, strutturali secondo un proprio modello e renderli disponibili come feed RSS. Meno sofisticato di Yahoo Pipes ha però il vantaggio di funzionare anche con i siti che non mettono a disposizione API o feed. Seguendo il DOM (document Object Model) raccoglie i dati da qualsiasi risorsa web. Certo il risultato non è dinamico ma comunque utile. Costruire directory e servizi con frequenza di aggiornamento abbastanza lunga diventa facilissimo. Può essere utilizzato come integrazione di Yahoo Pipes che non permette fare il Grab di siti che non offrono formati RSS o API.
  • OpenKapow: E’ praticamente Yahoo Pipes ma necessita di un client da installare. Non l’ho provato direttamente ma l’interfaccia grafica è meno accattivante di quella di Pipes

Conclusioni:

Tutti questi servizi che di fatto permettono la replica di servizi già esistenti e la loro combinazione di fatto favorendo la ridondanza portano a fare diverse considerazioni:

Per tutti i servizi che fungono da fonte di informazione costituiscono un sistema utile per aumentare la loro posizione nei motori di ricerca. La link popularity cresce a dismisura (con l’effetto collaterale che se il pagerank del sito che li utilizza è basso c’è il rischio che risulti penalizzante. Generalmente si rivolgono comunque ad un target internet friendly con la probabilità di finire su siti con un page rank intorno al 5;molto elevata).
Se è vero che “Content is The King”, trovare contenuti di valore e utilizzarli è sempre più facile. La variabile critiche per il successo di un sito su internet diventano quindi altre: la search engine optimisation, la user experience, il coinvolgimento degli utenti nella produzione di contenuti. Per chi progetta applicazioni e servizi internet quindi l’imperativo è “creare un ambiente “confortevole” per gli utenti e per i motori di ricerca. Anche se i contenuti sono disponibili altrove gli utenti torneranno dove si trovano a loro agio. La conseguenza sulla tutela dei propri contenuti è rilevante.
Cercare di difendere la proprietà ed i diritti sui contenuti diventa troppo costoso rispetto all’esigenza opportunità di scambiarlo e arricchire la propria applicazione o il proprio servizio. La condivisione porta maggiori vantaggi e contribuisce a diffondere il marchio e a far conoscere la propria attività.
L’ultima considerazione la lascio per il nostro paese. Come al solito in ritardo nel comprendere l’evoluzione rapidissima dell’economia della rete ma con delle opportunità. Con fatica ma grazie ad un intervento pubblico esistono numerose fonti di informazione istituzionale con contenuti che se ben assemblati potrebbero generare valore. Dati che in qualche maniera sono “pubblici” proprio perché offerti da siti della pubblica amministrazione. Un patrimonio che resta però confinato nei domini .it, e .gov. Sarebbe ora di aprire le porte, distribuire i dati attraverso RSS o meglio fornendo API ai diversi servizi. L’Internet Italiana ne beneficerebbe e subirebbe una salutare accelerazione che creerebbe valore.

fonti:

%d blogger cliccano Mi Piace per questo: