RAW, DATA, NOW!

Torno sull’argomento a seguito dei tanti commenti e dei contributi che ho trovato in rete, e lo faccio con enorme piacere.

Prima del Convegno di Roma, oltre ai contributi del bloggante sul tema, anche Nicola aveva indicato la strada con buoni esempi. Titti aveva raccontato un esperienza programmatica (alla quale anche il sottoscritto aveva collaborato) e Matteo aveva circonstanziato il tema anche da un punto di vista tecnico.

Per facilitarne la diffusione è utile segnalare anche l’articolo di Chiara e la videointervista di Ernesto che, sul sito di Forum PA,  hanno permesso di elaborare meglio la tesi, suggerendone alcune applicazioni possibili anche in Italia.

Secondo me, l’azione più importante ora, è quella di fare in modo che gli attori più “influenti”, che hanno avuto l’ opportunità di argomentare assieme al Presidente della Camera e ai maggiori rappresentanti di maggioranza e opposizione (Romani e Gentiloni in primis), comincino a maturare la convinzione che non basta la diffusione dell’infrastruttura (Banda Larga) e la difesa della democrazia e della neutralità per far crescere la cultura della rete. E’ IMPORTANTISSIMO convincerli che bisogna aprire i sarcofaghi, altrimenti senza i dati “grezzi” in rete l’economia immateriale non decolla.

http://commons.wikimedia.org/wiki/File:Sekikan.jpg
Wikimedia

I vari Luna, Quintarelli, Cortiana, De Martin e altri, potrebbero facilitare la diffusione della cultura Open Data. Michele mi ha promesso che lo farà già stasera.

Noi, di InnovatoriPA, lo faremo a Maggio al nostro Barcamp, ma abbiamo bisogno di più sostegno e, soprattutto, abiamo bisogno che il tema venga percepito come FONDAMENTALE anche dalle aziende.

Nel contempo, come ho fatto per l’Open Government, provo a dettagliare una scheda.

Enjoy

La dottrina dell’Open Government potrebbe sembrare sufficiente per imprimere un grande cambiamento, democratico, partecipativo e trasparente.

Invece, soprattutto la trasparenza, ha bisogno di spingersi più a fondo, laddove giace il patrimonio dei dati pubblici, quei dati che rappresentano ancora una rendita da posizione inespugnabile.

Il back-end pubblico, ovvero l’insieme dei sarcofaghi che conservano i dati dei cittadini e delle imprese, è ancora per lo più inaccessibile e, quando non lo è, appare difficilmente interpretabile, spesso a causa del formato dei dati che lo compongono. Quindi, c’è dell’ulteriore lavoro da fare.

Ancora una volta ci viene in aiuto la direttiva americana sull’Open Government che, in sintesi, definisce cosa si intenda per “formato open”: “Per formato open si intende un formato indipendente rispetto alla piattaforma, leggibile dall’elaboratore e reso disponibile al pubblico senza che sia impedito il riuso dell’informazione veicolata”.

Certo, sembra già un buon punto di partenza che, in ogni caso, deve essere sostenuto da una corretta interpretazione tecnologica. Per fortuna ci viene in aiuto, definendo il nuovo concetto di “linked data” , uno dei padri fondatori della rete, quel Tim Berners Lee che inventò il World Wide Web.

Berners Lee, indicato dal governo britannico come testimonial e advisor per il progetto Data.gov.uk (http://data.gov.uk/), ha fornito un contribuito fondamentale per la definizione di un contesto preciso e ha suggerito le soluzioni tecnologiche idonee per la libera circolazione dei dati sul web, in un suo ormai leggendario intervento al TED 2009.  

I dati, nella visione di Berners Lee, non hanno in sé proprietà relazionali, sono freddi, sono semplicemente dei dati. Singolarmente non sono utilizzabili, se non aggregandoli per estrarre valore dalle loro relazioni.
 
Ecco che il termine “Linked data” comincia ad assumere un significato più preciso. Si tratta esattamente di un modello che si predispone alla relazione e dunque all’interoperabilità per far fare ai dati quello che i link fanno già benissimo: garantire le relazioni bidirezionali,  favorirne l’accoglimento da parte di dizionari diversi, incoraggiare l’approccio semantico.

Nel suo articolo su W3C (Lee, 2009), lo stesso Berners Lee ha indicato il modello RDF (Resource Description Framework) come l’”interconnection bus” da utilizzare qualunque sia il formato con cui i dati vengono richiesti o forniti.

Il modello RDF, specifica l’autore, permette di linkare oggetti e concetti, facendo uso di URIs (Uniform Resource Identifier), collegare sistemi disegnati originariamente in maniera indipendente l’uno dall’altro, aggiungere interoperabilità quando questa è vantaggiosa, esprimere ogni dato in un set di vocabolari diversi.

Questa tecnica, accolta dal governo britannico nella declinazione dell’Open Data, è perfettamente integrabile con qualsiasi applicazione web e quindi ancora più lungimirante di quella americana.

Ma il problema è anche filosofico ed etico. Per rendere i dati disponibili è necessario educare alla condivisione e, forse, è proprio per questo che Berners Lee parla della sindrome da “abbraccio di database”, indicando la difficoltà da parte di alcuni detentori di dati nel “lasciarli andare”, in formato aperto, al riuso creativo da parte di altri.

L’Open Data britannico, dunque, suggerisce un approccio al fare, molto semplice e concreto, che potrebbe esserci d’aiuto nello sfuggire all’attrazione fatale che ci lega al binomio massime dichiarazioni & azioni, decisamente contenute.

Così si presenta il data.gov.uk:

“Questo sito web si propone di lavorare sull’integrità del patrimonio dei dati amministrativi al fine di avere dati:
· facili da usare
· facili da licenziare
· facile da riusare”

e questi sono i sui obbiettivi:

· lavorare con il web
· mantenere le cose semplici: l’ obiettivo è far si che il web funzioni meglio, apportando il minor cambiamento possibile
· lavorare con discernimento: non si cerca di cambiare il mondo. Si sa che alcune cose richiedono tempo, altre possono essere fatte in tempi relativamente brevi. Ogni cosa ha il suo tempo e segue il suo passo
· usare open standards, open source e open data: questi sono gli elementi centrali di un sistema modulare e sostenibile · costruire comunità e lavorare con e attraverso di esse (sia all’interno che all’esterno dell’amministrazione).

 L’intera filosofia dell’Open Data si basa dunque su un presupposto fondamentale: tutti i dati devono essere liberamente accessibili da parte di tutti, senza restrizioni di copyright, brevetti o altri meccanismi di controllo.

A questa filosofia molti liberi pensatori si sono ispirati, formulando di volta in volta delle argomentazioni che sono diventati dei propri e veri pilasti dell’Open Data:
· I dati appartengono alla razza umana. Esempi tipici sono i genomi, i dati sugli organismi viventi, i dati utili alla scienza medica, i dati ambientali.
· I fatti non possono essere legalmente protetti da copyright.
· Non si possono creare restrizioni sul riutilizzo dei dati.
· I dati sono necessari per rendere fluida l’esecuzione delle più comuni attività umane (dati cartografici, dati delle istituzioni pubbliche, ecc.)
· Nella ricerca scientifica, l’incremento delle scoperte è accelerato da un migliore accesso ai dati.

Ora non si tratta che darsi da fare, prendere tutto ciò che di buono viene esaltato da queste buone pratiche e portalo a buon fine anche in Italia, prima che siano i soliti grandi competitori internazionali a farlo.

Google, ad esempio, ha appena aperto i cantieri con il suo Google Public Data Explorer e non è detto che altre multinazionali non seguano l’esempio.

Non ci sono scuse, non c’è più un minuto da perdere. E’ necessario partire consolidando ed emulando le tante azioni dal basso dei mille innovatori che dentro la pubblica amministrazione si battono perché ciò avvenga, e bisogna farlo subito, senza aspettare azioni dall’alto che in Italia stentano ad arrivare.

Lo si deve fare, ascoltando i cittadini che lo pretendono e assecondando le aziende che ne hanno diritto per tornare a competere.

Post correlati

puoi lasciare un commento, o un link a questo articolo sul tuo blog.

6 Responses to “RAW, DATA, NOW!”

  1. Paolo Coppola scrive:

    Ma perche’ dobbiamo limitarci ai dati?? Anche i servizi devono essere open e riutilizzabili. I siti della PA devono essere sviluppati con pattern MVC e devono esporre web services e API per permettere a sviluppatori terzi di integrare i servizi nei loro siti. Cosi’ riusciremo a sfruttare appieno le potenzialita’ del web.
    mashup non e’ solo dati…

  2. Matteo Brunati scrive:

    @paolo: occhio paolo, che esporre i servizi e le API è già il web di oggi, in effetti. Dilemma: per ogni sito devo imparare la logica con cui questo vuole dialogare con il resto del mondo. Integrare fonti e servizi diversi diventa quindi oneroso e di esito non scontato.

    Qui c’è un passaggio ulteriore: parte della logica del dominio di conoscenza dei dati viene inserita direttamente nei dati stessi che oggi posso interrogare via webservices, senza dover re-imparare per ogni sito il modo di gestirli. La logica di business diventa in parte logica legata al dominio di conoscenza del contesto in cui si opera.
    Al posto di esporre i databases mettendo il livello dei servizi in condivisione, metto direttamente i dati NEL Web, pronti per essere gestiti in una maniera standard da qualsiasi applicazione o sito che mi venga in mente. Il mashup dei dati in tale forma abilita poi la nascita di servizi nuovi, non il contrario. ( anche via endpoint SPARQL ad esempio )
    Si salta una complicazione data dalla programmazione classica, nata secondo modelli dove gli ambienti distribuiti e imperfetti come il Web non c’erano o non venivano considerati.

    Ovviamente poi i servizi esposti nati da questi dati collegati tra loro nella cloud del Linked Data avranno una potenza incredibile: potranno trattare porzioni del Web come una vera e propria fonte dati nativa, senza passaggi di logiche middleware ulteriori. ( linked data )

    Oggi hai al massimo l’interoperabilità di xml, con rdf hai un vero e proprio metamodello comune ai dati che vuoi interrogare e gestire, in maniera nativa senza passare per un middleware di servizi se non è necessario. Un modello relazionale dei dati nato nel Web per sfruttarne le caratteristiche native, a partire dall’assunzione di mondo aperto ( io so di non sapere tutto alla Socrate in pratica, vedi wikipedia ). ( avevo già segnalato Data and the Web – a great many of choices per capire le differenze )

    E’ un passaggio notevole. Come dai files di documenti e l’ipertesto, in un certo senso.

    Giusto per avere un’idea della differenza tra xml e rdf:
    -> RDF e XML

  3. Paolo Coppola scrive:

    @Matteo: grazie per la spiegazione che fa sempre bene. Il mio riferimento pero’ e’ alla PA. Non sono a conoscenza di servizi online forniti dalla PA e accompagnati da API che permettano ad uno sviluppatore terzo di integrarli in un suo sito. Banalizzo: le metto i certificati dell’anagrafe online, dovrei farlo con delle API, di modo che, per esempio, qualcuno possa scriversi una piccola applicazione per, sempre ad esempio, facebook e i cittadini si troverebbero i certificati online nel loro social network preferito. Nulla di nuovo se non un modo diverso di vedere lo sviluppo del web per le pubbliche amministrazioni, che sfrutti di piu’ la collaborazione. In piu’, separando il “view” dal “model” e “controller” e, magari, trovando degli standard a livello di PA per il “model” le varie pubbliche amministrazioni potrebbero scambiarsi pezzi delle loro applicazioni realizzando veramente la riusabilita’.
    Sui linked data ammetto di non essere appassionato, come non lo sono di RDF. Penso che la semantica debba essere ben separata dai dati. Ma qui, se non interpreto male il post di Gigi, questo aspetto importa poco. Importa invece il cambio di filosofia che spinge a rendere pubblici e facilmente riutilizzabili i dati nei siti delle PA. La trasparenza, tanto cara a Brunetta, non si realizza mettendo pdf online o levando pagine dall’indicizzazione, ma esponendo dati pronti.
    L’e-government, a mio modesto pare, ha bisogno anche dell’esposizione dei servizi e delle API.

    • gigicogo scrive:

      Paolo, la fase dei business-mashup la considero già superata come logica. Ovvio che la PA stenta, arranca, insegue e son pochi gli esempi in questo senso, anche perchè è più oneroso (e quindi più remunerativo per i fornitori) sviluppare applicazioni end 2 end anche sul web.
      SOA, API esposte per tutti linguaggi del web, SELF-SERVICE MASHUP attraverso l’esposizione di embedded code, rss, object schema, ecc., lo considero un già fatto, da un punto di vista tecnologico. Il problema è che se SPC non funziona, è perchè è troppo complesso. Ne avevo già parlato in questo mattone: http://www.webeconoscenza.net/2009/01/27/egovernment-20/ che ho rivisitato, corretto e ora sottoposto a verifica per un lavoro più complesso che presenterò al Barcamp di Maggio al ForumPA.

      A proposito, spero che Matteo possa essere dei nostri al Barcamp di Maggio perchè ci sarà una sessione sull’Open Data e ci servono studiosi e appassionati come lui per aprire le teste ai manager e ai politici che verranno.

      Grazie a entrambi per il contributo.

  4. Matteo Brunati scrive:

    @paolo : grazie a te per lo scambio. Conosco poco la PA, ma anche nel privato non vedo grossissime differenze nell’adottare certe metodologie, che per forza di cosa sono disruptive e quindi scomode al sistema attualmente in uso. Poi, siamo in Italia, e fare innovazione vera e utile sappiamo cosa significa, dalla PMI alla PA passando per le poche grosse società che abbiamo nel Paese. La PA per motovi storici e di contesto è assai più indietro, su questo non vi è dubbio.
    Poi quello che vedo io come esterno è che i sistemi nuovi per togliere dei passaggi a livello tecnologico per ottenere certi effetti forse non vogliono essere compresi per non mettere in crisi una serie di elementi assodati. Quindi serve divulgare quello che qualcuno ha fatto con tali approcci e mostrarne i vantaggi. L’unica strada per provare a cambiare qualche testa .) E a rendere più trasparente e gestibile una filiera che tocca comunque tutti quanti, no? .)

    Poi la verità è che si sta andando verso un territorio nuovo e relativamente inesplorato, e quindi serve un po’ di sale in zucca e molta formazione intermedia.
    Per quanto riguarda la semantica, forse già un po’ di struttura in più permette grandi passi in avanti, senza dover pensare all’inferenza sempre e comunque. Almeno proviamo a capire le differenze ed i vantaggi di questi modi nuovi di usare il Web, tutti assieme. Ovviamente non esiste la soluzione perfetta a tutti i problemi, e magari ci fosse.
    E’ dal confronto tra passato e futuro che si potrà migliorare, riusando ciò che si è imparato anche dal modello MVC.

    @gigicogo: concordo nella complessità del mattone delle SOA, e da appassionato studioso di queste cose posso dire che proverò ad esserci al BarCamp di Maggio, viste queste premesse. Serve il confronto su questi temi per capire come inquadrarli meglio, e maggiori esperienze si mettono sul campo, meglio si potrà gestire la cosa e fare passi in avanti.

  5. [...] 2010 (e sottotitolato anche in italiano), in cui ad un anno dall’ormai noto “raw data now“, vengono mostrati un po’ degli interessanti risultati che possono nascere una volta [...]

Rispondi

Subscribe to RSS Feed Webeconoscenza è su Twitter!