Semantic Web e Linked Open Data: cosa sono e perché sono efficaci

Al fine di spiegare meglio lo scopo del progetto CoBiS LOD e i vantaggi di un catalogo aumentato grazie all’utilizzo della tecnologia Linked Open Data, andiamo a scoprire di cosa si tratta.

Cosa sono i Linked Data?

Immaginiamo di voler cercare un testo con caratteristiche particolari: ad es. su un argomento specifico, pubblicato in un certo luogo, appartenente a un preciso periodo storico, che abbia come autore un italiano che ha studiato in una università piemontese. Apparentemente questa ricerca risulta difficile da fare in breve tempo e in simultanea, ma con i Linked Open Data è possibile!

5 star deployment scheme for Open DataQuesto perché si tratta di dati:

  • strutturati, seguono un preciso formalismo standard (RDF – Resource Description Framework) per consentire anche ai computer di leggere e interpretare le informazioni presenti nel web;
  • aperti, liberamente accessibili sul Web;
  • identificati univocamente, tramite URIUniform Resource Identifier;
  • collegati tra loro.

lod-cloudRispetto al proprio dataset, una volta rilasciati con licenza aperta i dati, questi possono essere collegati a dati affini di fonti esterne disponibili sul Web; in questo modo, si contribuisce a popolare la Linked Open Data Cloud, formando un reticolo informativo sempre più ampio.

Come approfondiremo, i dati strutturati risultano leggibili anche per le macchine e possono essere interrogati attraverso il linguaggio SPARQL (SPARQL Protocol and RDF Query Language); questo linguaggio di interrogazione, insieme al formalismo standard RDF, costituisce uno degli elementi principali del Semantic Web.

Semantic Web: dal Web dei documenti al Web dei dati

Si tratta dell’idea di Tim Berners-Lee, inventore del World Wide Web, di estendere il Web tradizionale trasformando il Web di documenti collegati tra loro in Semantic Web, un Web di dati dotati di valore semantico.

Nel primo caso, i documenti sono collegati tra loro attraverso semplici collegamenti (link); nel secondo caso, invece, questi sono associati a metadati che specificano il tipo di relazione che intercorre tra i dati, strutturati in un formato interrogabile e interpretabile da un elaboratore.

La presenza nei documenti di parole chiave consente la costruzione di reti di relazioni tra documenti, quindi di effettuare ricerche molto più specifiche.

Strutturare i dati secondo il formalismo standard RDF

Per comprendere il concetto di dato strutturato possiamo fare un esempio. Quando studiamo un testo sottolineiamo le informazioni che per noi sono più importanti ed estraiamo dati da memorizzare; lo facciamo mettendo in evidenza date, nomi, luoghi che, isolati dal contesto testuale, una volta strutturati sono utili per creare mappe concettuali e collegamenti con altri argomenti.

Nel caso dei Linked Open Data, sono i singoli dati che, in relazione semantica tra loro, una volta interrogati creano informazioni.

Questo sistema di collegamenti semantici è basato sull’associazione di un’etichetta/termine, che permette di specificare la tipologia delle relazioni, e su una struttura dei dati che segue la sintassi RDF.

La struttura della tripla è tripartita in:

SoggettoPredicatoOggetto, in cui il soggetto corrisponde alla risorsa da descrivere, il predicato alla proprietà che lega la risorsa all’oggetto, il quale costituisce il valore della proprietà.

Il valore può essere un’altra risorsa, una data, un numero, un evento, un link o anche un ID.

Facendo un esempio, l’informazione “Luigi Pirandello è autore della tragedia Enrico IV” si tradurrebbe in:

Pirandello - haScritto - Enrico IV .

Enrico IV - genere - tragedia .

In questo modo, il formalismo RDF consente l’interpretazione da parte delle macchine; le risorse, identificate univocamente a livello globale tramite URI, possono essere collegate ai dati corrispondenti su altre fonti esterne, arricchendo automaticamente i propri dati.

Come approfondiremo nel prossimo articolo, le risorse si descrivono attraverso termini definiti da ontologie e vocabolari controllati che stabiliscono le tipologie di relazioni in base ai domini di riferimento.

Come possono creare valore per gli istituti culturali?

Al fine di preservare, condividere e valorizzare i dati del patrimonio culturale, la trasformazione dei dati del proprio catalogo in Linked Open Data costituisce una buona strategia per ampliare il potenziale informativo di partenza e contribuire a realizzare una rete di conoscenza distribuita sul Web.

La tecnologia Linked Data nasce proprio con lo scopo di favorire l’interoperabilità tra fonti di dati eterogenee pubblicate sul Web, grazie all’uso di una struttura standard, di identificativi univoci e vocabolari condivisi.

books-2665628_1280Molti istituti culturali hanno iniziato ad aprire i propri cataloghi, rendendoli disponibili in rete utilizzando standard di interoperabilità, collegando e arricchendo i propri dati, ma anche quelli delle altre fonti distribuite allo stesso modo nel Web.

Questo comporta un arricchimento automatico nel tempo dei dati del “catalogo aumentato”, con il progressivo aumento del numero e della qualità di dati aperti disponibili online. Il collegamento con fonti esterne e l’interazione con le community di database collaborativi, come Wikidatacostituisce non solo la possibilità di arricchire il catalogo in tempo reale con altre informazioni di contesto, ma di poter effettuare ricerche che vanno oltre il dominio di riferimento bibliografico (per scoprire, ad esempio, informazioni biografiche sugli autori e tipologie di relazioni con altri autori).

Nel caso del progetto CoBiS LOD, grazie alla trasformazione in LOD dei dati eterogenei delle biblioteche aderenti, adesso è possibile consultare le risorse, che si arricchiscono in automatico dei dati provenienti da fonti esterne a cui sono collegati, attraverso un unico punto di accesso;  le risorse possono essere interrogate da portale o tramite endpoint per impostare ricerche più specifiche con SPARQL, il linguaggio di interrogazione standard.

Sono disponibili le slide sul progetto Cobis Lod.

Per approfondire l’argomento continuate a seguire i canali social e il sito del CoBiS.