Una nuvola di dati pronta per generare nuovi business… il paradiso dei programmatori

Una mia intervista a Matteo su ForumPA

Il 20 novembre scorso ha aperto ufficialmente il contest Appsforitaly, il concorso aperto a cittadini, associazioni, comunità di sviluppatori e aziende per progettare soluzioni utili e interessanti basate sull’utilizzo di dati pubblici, capaci di mostrare a tutta la società il valore del patrimonio informativo pubblico. Sul rapporto tra open data e web semantico e sulle opportunità che questi nuovi scenari potrebbero aprire, Gianluigi Cogo, Segretario generale dell’associazione opengovitalia, ha intervistato Matteo Brunati di IWA Italy (International Webmasters Association Italy) esperto di semantic web.

Quanti e quali sono i cataloghi di dati aperti a cui uno sviluppatore può attingere per sviluppare un applicazione che risulti vantaggiosa per cittadini, istituzioni e imprese?

I principali cataloghi di dati aperti sono quelli pubblicati sul portale ufficiale degli Open Data italiano, dati.gov.it, e sui portali regionali della Regione Piemonte e della Regione Emilia Romagna. Altri sono quelli di Spaghetti Open Data e la versione italiana dell’aggregatore di dati aperti europeo it.ckan.net. Questi sono i cataloghi principali, poi in realtà per il contest AppsforItaly si può e si dovrebbe stimolare l’apertura dei dati, facendo “scraping” dei dati già presenti nei siti. Significa elaborare in maniera automatica delle estrazioni dai siti pubblici dei dati presenti, che però non sono ancora stati rilasciati e quindi elencati nei cataloghi. Esistono ad esempio servizi per facilitare questo tipo di lavoro, come Scraping Wiki. Tutto questo perché non basta avere i dati aperti già a disposizione, ma la creatività dei singoli e delle imprese devono stimolare l’apertuta di nuovi dataset. Non sempre ci si rende conto che i dati dei siti sono comunque pubblicati, anche se per usarli occorre fare del lavoro ulteriore.

Questi cataloghi prevedono per i dataset una caratterizzazione semantica? C’è uno standard per descrivere un catalogo di dati e renderlo interpretabile da uomini e macchine?

Vediamo di chiarire un po’ le cose. Una cosa sono i cataloghi, ed un’altra sono i dati. In generale c’è uno standard per descrivere le cose del mondo in modo che sia comprensibile prima dalle macchine e poi da noi umani. Si chiama RDF ed è uno dei mattoncini che vanno a formare il Web of Data, una dimensione tecnica del Web più evoluta di quella che noi tutti usiamo, e che esiste già oggi in piccole porzioni. Un altro nome con cui si denota il Web of Data è Semantic Web, un altro è Linked Data: poco importa. L’idea di fondo è stata già incontrata dai lettori di FORUM PA, ma è utile ribadirla. Tramite RDF riesco a dare delle singole caratteristiche alle cose del mondo, come l’analisi logica che imparavamo a scuola, alle elementari. Soggetto, verbo e complemento oggetto. La differenza è che i nomi oggi per essere universalmente riconosciuti hanno bisogno di essere un URI, cioè un nome che inizia per http://. Con questo meccanismo posso creare della conoscenza accessibile alle macchine, in maniera universale. E creare poi delle versioni comprensibili a noi umani.

Tutto questo vale anche per i cataloghi di dati. In questo caso serve mettersi d’accordo su alcune proprietà di base: il nome del catalogo, chi ne è il responsabile, la licenza associata, il formato dei dati di cui si sta parlando, gli argomenti di cui parlano questi particolari dati e via dicendo. Il primo passo per questi cataloghi è utilizzare le stesse forme di metadati, ovvero banalmente gli stessi campi descrittivi dei datasets. Al momento lo standard de facto della catalogazione a livello europeo è rappresentato dal CKAN, oggi thedatahub.org. Viene usato tra gli altri anche come backend del famoso data.gov.uk, e dal catalogo generale publicdata.eu. Il secondo step in corso d’opera è rendere questo catalogo e questi metadati interpretabili come Linked Data, attraverso la loro semanticizzazione. In effetti con CKANquesto passo è stato fatto relativamente da poco. Una volta raggiunto questo livello, possiamo immaginare programmi, e le famose apps, ma anche servizi web, che possano interrogare in maniera automatica i dati online, automatizzando attività che oggi dobbiamo fare manualmente.

Questi cataloghi si possono federare fra loro? Che attenzioni e tecnologie bisogna mettere in campo?

Il concetto di data federation è abbastanza semplice, tutto sommato: l’idea di base è che pian piano si usi la Rete come un immenso ed unico database, interrogandolo su opportuni punti di accesso, non importa molto da dove, in maniera semplice e automatica. Questo avviene attraverso la semanticizzazione e gli standard adottati a livello di API, quindi di porte che i programmatori possano interrogare per recepire i dati. Ma soprattutto sono i dati nella nuvola, che possono parlare tra loro, aggiornandosi quando necessario. Sono aspetti ancora in corso di standardizzazione, ma l’Unione Europea sta finanziando da diversi anni la gestione della nuvola di dati semantici, a disposizione della collettività. Le tecnologie chiave sono l’utilizzo di endpoint SPARQL, che per noi umani è sia un punto di accesso per interrogare i dati (come il linguaggio SQL per dialogare con i singoli database), sia un protocollo di accesso e di pubblicazione, interrogabile anche dai programmi.

Ad oggi su questo tema è interessante vedere come siano nate filiere nuove per mantenere queste nuvole di dati, che sono per lo più un nuovo tipo di bene comune, di commons, che in effetti le fondazioni riescono a gestire ed a difendere in maniera egregia. Perché la federazione di questi dati crea qualcosa che è di tutti, stante le licenze in uso relative agli Open Data, e quindi crea delle aspettative diverse anche dal lato organizzativo e di business. Le fondazioni e le società non a scopo di lucro sono una tipologia interessante e vicina a questi temi, in effetti. Quindi non solo attenzioni tecnologiche, ma anche sociali: siamo nel campo dell’innovazione sociale a tutto tondo.

Mi sembra di capire che una condivisione di metadati descrittivi e dizionari semantici in ottica di “ontologie ufficiali e certificate” sarebbe un passo importante? Come ci si può arrivare?

È una problematica emersa all’estero, in Italia è ancora prematuro parlarne. Per questo è nato un nuovo gruppo di lavoro del W3C, il consorzio che mantiene e sviluppa gli standard alla base del Web di oggi e di domani. Nel charter è prevista la pubblicazione di linee guida dettagliate sui vocabolari e sulle modalità da utilizzare per facilitare una meta descrizione condivisa. La tecnologia semantica permette un’integrazione veloce tra dati e domini differenti, ma la coesione sociale derivante dall’uso di descrivere gli stessi dati in maniera condivisa è sicuramente da portare avanti. Anche perché i governi creano processi top-down inevitabilmente, se questi risultano più condivisi c’è meno lavoro di pulizia dei dati integrati e più lavoro per la parte creativa sopra di essi.

Sarebbe possibile ricercare i dati su più insiemi di datasets o di cataloghi?

Certamente che sarebbe possibile: ovviamente serve l’adozione del livello tecnico SPARQL per facilitare questo lavoro. Anche la pubblicazione delle API per il singolo catalogo facilita questo compito, ma lo rende impegnativo. Se ogni catalogo pubblica un suo dialetto per interrogare i dati, i cari programmatori devono studiarlo per ogni singolo sito, al posto di doverlo imparare una volta sola e poi automatizzare il tutto. È  come se su una ricetta di cucina si usassero metriche diverse per le dosi dei singoli ingredienti, per dire. Stanno nascendo servizi che integrano i punti di interrogazione sparsi per la Rete, quindi nuovi modelli di business a disposizione del Mercato.

Pensi che i programmatori capiscano il valore della federazione e della aggregazione di più fonti di dati?

Il gap per i programmatori è notevole: nel senso che il modo in cui si sono formati tradizionalmente non prevede di addentrarsi sugli aspetti legati, su dati distribuiti appartenenti non alla società per cui si lavora e via dicendo.  Diciamo che anche quando sono stato ad uno degli incontri dei gruppi di lavoro del W3C questa primavera, si percepiva lo scollamento che esiste oggi tra le comunità. Per questo i contest sono importanti: sono leve per fare breccia nei meccanismi di business classici a cui i programmatori sono stati abituati e si mostra loro quanto c’è di nuovo. E quante possibilità abbiamo oggi di non reinventare la ruota. Credo che la consapevolezza della nuvola di dati sia un paradiso per i programmatori, e la legalità di poterli usare sia una delle innovazioni dirompenti rispetto al mondo chiuso in cui operano tradizionalmente. L’ostacolo a mio avviso è più sociale che tecnologico.

Vecchio compagno modem

Chi lo avrebbe mai detto che i primi modem sono stati sperimentati nel lontano 1943 da IBM? Eppure, questa infografica prodotta da http://www.broadbandchoices.co.uk/ ci accompagna per mano in una storia che, ormai, è anche la nostra storia.

Questo aggeggio, nelle sue varie versioni, può essere assimilato ormai ad un elettrodomestico e, come il frigo o la televisione, è sempre acceso in tutte le case.

Open Polis = Open Data

Oggi Openpolis pubblica un interessante analisi comparata sull’età e l’esperienza del governo Monti paragonata agli altri governi europei.

L’aspetto interessante della ricerca, oltre al rapporto ben struturato e completo di chart: http://dossier.openpolis.it/tecnoprofessori/report.pdf, è la disponibilità dei dati in formato Open, per poterli scaricare, aggregare ed elaborare. Certo, mancano i metadati, ma è un bel passo avanti. Ora mi metto in contatto con loro per il contest di Appsforitaly  perchè questi sono proprio un bell’esempio di “dati sociali open” da aggregare con quelli della PA

 

Il passato del faccialibro

Che una parte della nostra vita (sociale?) ormai appartenga al faccialibro è abbastanza vero e incontrovertibile. Anche se, come affermano i creatori di: http://archivedbook.com/ “… There is no rule and everything looks pretty arbitrary. For instance, wall messages can go up to 2005 and links to 2007, but statuses posted before June 2009 aren’t apparently available anymore. Also, some specific privacy settings might also affect the results.”

Dunque, volendo fare un tuffo nel passato alla ricerca di link, foto o messaggi di status, si può fare in modo intuitivo.
L’uso? Io sono andato in profondità per curare un po’ la reputazione….vedi mai che quella poca rimasta :-)

Nel caso volessimo letteralmente SCARICARE sul nostro computer tutto quello che abbiamo fatto in questi anni sul faccialibro, possiamo farlo comodamente da questo link: https://www.facebook.com/help/?page=116481065103985

Enjoy

 

Il Ministro della rete

Leggo da una decina di giorni numerosi appelli e lettere a un ipotetico Ministro di Internet. Altre lettere e petizioni, più banalmente, invocano un Ministro dell’innovazione, come se rete, internet e digitale fossero sinonimi di innovazione.

Di banalità ne leggo molte e mi spiace sottolinearlo con acidità e supponenza ma, quando ci vuole ci vuole. Riportiamo i temi e i contesti nei loro confini, per favore e proviamo ad analizzare i problemi strutturali di questo paese.

Se vogliamo continuare a parlare di innovazione, forse, dobbiamo scrollarci di dosso questa analogia inesistente. Lo scrivevo mesi fa, per ricordarlo a me stesso e a chi legge:

….. Non basta nemmeno farsi pervadere ogni giorno dall’ultima tecnologia digitale. L’inovazione non è solo tecnologia.

Ecco il punto, dolente. Ogni smanettone abile, curioso e appassionato di tecnologia si erge ad innovatore. E spesso si spaccia pure per esperto …..

Senza scomodare i dizionari ufficiali, basta dare un occhiata alla nostra cara Wikipedia per rendersi conto che l’innovazione è una filosofia complessa che si attua solamente cambiando i processi organizzativi e non solo: “… Innovazione è una’attività di pensiero che, elevando il livello di conoscenza attuale, perfeziona un processo …”.

L’innovazione non è “rinnovamento tecnologico”. L’innovazione non è “adeguamento tecnologico”. L’innovazione non è “predisposizione tecnologica”. E lo sottolineo ancora, perchè la maggiorparte dei cenacoli, dei social network tematici, dei blog che argomentano sul tema, continuano a confondere il costante e obbligato rinnovamento tecnologico, con l’innovazione.

Un ulteriore spunto me lo offre l’editoriale di Carlo Mochi su ForumPA:

“Si può certamente fare a meno di un Ministro per l’Innovazione (o tanto più di un immaginifico Ministro per Internet!), ma non si può fare a meno, quindi, di una politica di innovazione che sia unitaria, coesa e di lungo periodo ……

….. Ripeto: per tutto questo e per le altre decisive scelte che abbiamo davanti, e che ho volutamente trascurato, non serve necessariamente un Ministro per l’innovazione, ma serve necessariamente una lungimirante politica per l’innovazione.”

Dunque la politica, intesa come mandato, come compito, come onere derivato da una delega e soprattutto come obbligo a perseguire ed attuare un programma scelto e votato dalla maggioranza dei cittadini è lo strumento unico e strategico.

La politica deve fare suo il processo innovativo e proporlo come regola in ogni settore sociale ed economico. Dunque una politica che favorisca il cambiamento dei processi che, purtroppo, in Italia sono quelli che connotavano la società del secolo scorso.

Cambiare i processi significa dunque innovare. Non cambiarli, significa conservare, stagnare e deprimere.

Veniamo però al tema delle Agende digitali (Europee, nazionali???, locali, ecc.). E’ vero che molti studiosi ed economisti indicano nel digitale un opportunità e, quasi dappertutto, questo tema viene suddiviso in tre sottotemi fondamentali (INFRASTRUTTURA, SERVIZI e CULTURA).

Si dice, si profetizza, si enuncia ovunque che perseguire processi innovativi basati fortemente sull’ausilio delle tecnologie favorisca una nuova economia e un nuovo benessere. Forse è vero, ma non è scontato.

Una società che non sa innovare i processi organizzativi non può pretendere che gli stessi vengano cambiati dagli strumenti tecnologici. Non basta dotarsi di infrastruttura e servizi, serve soprattutto un cambio di passo culturale che solo un’accorta politica può determinare.

Dei tre sottotemi suddetti (INFRASTRUTTURA, SERVIZI e CULTURA), viene spesso ignorato il terzo. E la politica per prima lo ignora. Come si può pensare che un economia fordista e conservatrice, basata su processi organizzativi datati, possa trarre benefici solamente dall’infrastruttura e dai servizi?

Pensiamo solo a uno dei tanti temi che la politica attuale sta affrontando: il denaro elettronico. Infrastruttura e servizi per aderire incondizionatamente a questo processo, ci sono già.

Si pensa di poter emanare una legge che obblighi l’uso del denaro elettronico da parte delle PMI, da parte degli artigiani e commercianti al dettaglio per combattere l’evasione. Giusto, giustissimo? Ma su quale pianeta?

Quello italiano? Dove non trovi nemmeno il POS dal benzinaio? Per non parlare del meccanico o del fiorista?

Sul pianeta Italia dove si stima che a Natale l’eCommerce favorirà solo il 6% degli acquisti totali?

In Italia dove la maggioranza dei notai e degli avvocati pretendono l’assegno cartaceo e se gli parli di bonifico ti credono un marziano?

E potrei affrontare ogni tema dell’Agenda politica attuale e dimostrare che non c’è volontà di attingere ai vantaggi del digitale perchè è chiaro che ciò comporterebbe un cambiamento dei processi organizzativi. Chi gestisce l’home banking del carrozziere che ogni sera va a consegnare il denaro di carta alla cassa continua? Chi gestisce il sito di eCommerce del fiorista?

Non serve un ministro digitale o un ministro della rete, serve un azione di alfabetizzazione di massa che parte dalle scuole e arriva alle università, ma passa anche per dei 118 digitali (veri e propri centri di primo intervento) che aiutino le aziende a comprendere che i nuovi processi organizzativi possono trarre vantaggio dal digitale se, prima di tutto, ci si apre incondizionatamente al cambiamento e all’innovazione dei processi organizzativi. BISOGNA CAMBIARE IL MODO DI LAVORARE E RELAZIONARSI!

Non c’è alternativa e, per fare ciò, non serve un Ministro, serve che tutta la classe politica metta al centro dei programmi della prossima legislatura una nuova alfabetizzazione di massa perchè, oggi, il nostro problema è che siamo IGNORANTI e purtroppo, molti politici sono solo degli IGNORANTI CON L’IPAD!

Madonna 2.0

Oggi nella mia città si festeggia la Madonna della Salute una grande festa cristiana e allo stesso tempo laica che coinvolge tutta la popolazione. Per chi non conosce la storia, rimando alla versione sintetica di Wikipedia.

Sempre oggi stavo riordinando delle foto scattate a Montreal e mi è tornata in evidenza quella che, quest’estate, ho scattato dentro la Notre-Dame-de-Bon-Secours Chapel, un altra struttura cattolica che venera la Madonna.

18082011-IMG_3733

Dunque, se è vero che marketing e pubbliche relazioni, in salsa social media, stanno cambiando paradigmi e stili, forse va enfatizzato come i canadesi percepiscano le potenzialità indotte anche dal web sociale in ambiti, da noi, ancora poco attenti e spesso refrattari.
La chiesa, ovviamente, è la porta d’ingresso al museo e questo necessità di marketing a buon prezzo (sociale), ma va rilevata l’enfasi social che anche sulla porta della chiesa invita il visitatore a privilegiare strumenti e spazi web 2.0 come Flickr e Facebook per condividere le foto.

Tutto questo accade a Montreal.