Cos’è Wikidata, come funziona e come sono integrati i dati del catalogo CoBiS LOD

Wikidata è un database di conoscenza libero, collaborativo, multilingue che raccoglie i dati strutturati delle risorse, leggibili anche dalle macchine.

Le risorse sono collegate ai corrispondenti contenuti disponibili sulle altre piattaforme dei progetti Wikimedia, come Wikipedia, Wikimedia Commons, e ad altre fonti liberamente accessibili sul web che li rendono verificabili, come VIAF (Virtual International Authority File), SBN, BNF e Internet Archive.

Può definirsi un hub di dati (pubblicati con la licenza Creative Commons zero (CC0) e provenienti da diverse fonti LOD disponibili sul web) che consente di effettuare ricerche standard attraverso l’interfaccia o di andare più in profondità personalizzando la domanda con il linguaggio di interrogazione SPARQL attraverso un punto di accesso ai dati.

Per i risultati, in base all’impostazione della query e ai requisiti da soddisfare, è possibile scegliere il tipo di visualizzazione grafica come mappe, tabelle, grafici e timeline.

Dati strutturati e collegati secondo un modello standard

I dati inseriti sulla piattaforma seguono un modello standard di descrizione, caratterizzato dalla struttura soggetto – predicato – oggetto, che identifica univocamente ogni risorsa descritta e collegata ad altre risorse attraverso le proprietà che ne definiscono il tipo di relazione.

Wikidata in breveQuesta struttura consente non solo all’occhio umano di leggere i dati, ma anche alle macchine di interpretarli grazie all’utilizzo di codici specifici. 

Infatti, ogni risorsa è caratterizzata da un codice composto dalla lettera Q seguita da cifre numeriche, ad es. Q5 identifica il concetto di essere umano; invece, il codice di una proprietà è caratterizzato dalla lettera P seguita da cifre numeriche, ad esempio P31 è la proprietà che permette di specificare a livello semantico la natura di una determinata risorsa attraverso l’etichetta “istanza di” (Danteistanza diumano). 

Come e perchè allineare un catalogo a Wikidata

Tutte le entità sono raggiungibili tramite un URL e identificate in maniera univoca da un codice numerico utilizzato dalla comunità di Wikidata per creare un identificativo specifico corrispondente all’id degli autori del catalogo CoBiS LOD tramite la proprietà identificativo CoBiS di un autore.

Dante interlinking WikidataLa proprietà creata stabilisce un’equivalenza tra i dati descritti sul catalogo e quelli presenti su Wikidata creando una  relazione attraverso l’ID di riferimento.

Una volta effettuati gli allineamenti, è possibile impostare anche un ritorno di dati da Wikidata verso il portale del catalogo CoBiS LOD; in questo modo le informazioni presenti nelle pagine degli autori si arricchiscono con nuove informazioni provenienti da fonti esterne. Come? Impostando una specifica query SPARQL, (SPARQL Protocol and RDF Query Language), linguaggio specifico di interrogazione di dati strutturati.

Questo è uno dei vantaggi dell’integrazione dei dati del proprio catalogo alle fonti della Linked Open Data Cloud e, in questo caso specifico, alla base dati di conoscenza libera Wikidata.

Infatti, l’integrazione dei propri cataloghi con Wikidata permette di far convergere in un unico punto di accesso i dati di singoli progetti che poi dialogano e si arricchiscono rispettivamente accrescendo il patrimonio iniziale (es. opere di autori con ID CoBiS, link ad Internet Archive, ID SBN) e rendendo possibile effettuare ricerche più approfondite.

Vi siete mai chiesti, ad esempio, quali autori hanno scritto riguardo i viaggi letterari, quali autori hanno scelto come ambientazione geografica delle proprie opere il paese in cui hanno studiato? o se gli autori sono in relazione tra loro per specifiche ragioni?

Questo è un altro vantaggio, interrogando contemporaneamente database che raccolgono informazioni di tipo diverso è possibile effettuare ricerche specifiche incrociando i dati

Proponiamo di seguito qualche esempio.

Come impostare la ricerca con SPARQL

Come raccontato nell’articolo Interrogare i dati catalografici del CoBiS LOD con SPARQL, è necessario strutturare in modo preciso la domanda inserendo le variabili, che vengono scritte con un punto interrogativo all’inizio della parola, e i parametri per individuare le informazioni di interesse all’interno della base di conoscenza.influenze Dante 

Le componenti principali da inserire sono la:

  • SELECT che contenga la richiesta, le variabili con i risultati da visualizzare;
  • WHERE con informazioni e istruzioni per la ricerca dei dati richiesti, ad esempio sulla natura dei dati da cercare o filtrando per periodo di interesse.

Se volessimo scoprire da quali autori presenti nel catalogo fu influenzato Dante come andrebbe impostata la query?

In cima va impostata di default la visualizazione graph scrivendo il commento #defaultView:Graph
come di seguito:

#defaultView:Graph

SELECT ?advisor1 ?advisor1Label ?image ?advisor2 ?advisor2Label

WHERE {

  wd:Q1067 wdt:P737* ?advisor1 .

  ?advisor1 wdt:P737 ?advisor2 .

  OPTIONAL {?advisor1 wdt:P18 ?image .}

  ?advisor1 wdt:P7865 ?idautorecobis .

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }

}

Vai al risultato.

Nella WHERE inseriamo Dante (Q1067) come soggetto della nostra ricerca e che si vuole scoprire con quale advisor è in relazione attraverso la proprietà influenzato da (P737).

Aggiungiamo di voler estendere la ricerca anche alle relazioni relative ai suoi advisor con la stringa

?advisor1 wdt:P737 ?advisor2 . 

In fine, chiediamo di poter visualizzare le immagini nel caso siano disponibili utilizzando OPTIONAL (per non escludere i risultati per cui non è disponibile un’immagine):

OPTIONAL {?advisor1 wdt:P18 ?image .}

Nella SELECT va inserito il soggetto della ricerca ?advisor1 specificando di restituire come risultato oltre all’identificativo anche la loro etichetta ?advisor1Label (specificando utilizzando SERVICE i parametri sulla lingua per visualizzare l’etichetta), l’immagine e la catena di persone influenti per gli advisor di Dante (?advisor2).

Quali sono gli autori presenti nel catalogo CoBiS LOD collegati a Wikidata tramite ID autori CoBiS

SELECT ?author ?authorLabel ?image
WHERE {
 ?author wdt:P7865 ?idautorecobis .
 OPTIONAL {?author wdt:P18 ?image .}
 SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}

Vai al risultato.autori CoBiS

Per scoprirlo va inserita una tripla che abbia come soggetto la variabile ?author in relazione con l’ID del catalogo attraverso la proprietà creata P7865.

Per approfondire consulta il tutorial SPARQL disponibile su Wikidata.

Autori e opere del catalogo CoBiS LOD presenti su Wikidata

Viceversa, dal portale LOD del CoBiS è possibile impostare query SPARQL per individuare quali autori hanno l’interlinking con Wikidata tramite la property owl:sameAs e quali edizioni con con lo stesso ID SBN sono disponibili su Wikidata utilizzando la property cobis:hasWikidataURL.

Per scoprire gli interlinking può essere utilizzata la query seguente in cui è inserita la proprietà owl:sameAs che stabilisce una relazione di uguaglianza tra due risorse presenti in fonti diverse:

SELECT distinct ?author ?name

       WHERE {

       ?author rdf:type bf2:Person.

       ?author owl:sameAs ?o .

       ?author schema:name ?name .

       }

ORDER BY ?name

Vai al risultato.

Numero autori con interlinking sul portale CoBiS LOD:

SELECT (count(distinct ?author) as ?n) 

       WHERE {

       ?author rdf:type bf2:Person.

       ?author owl:sameAs ?o .

       ?author schema:name ?name .

       }

Vai al risultato.

Opere del catalogo del CoBiS LOD con voce su Wikidata

SELECT distinct ?id ?name

WHERE {

?instance cobis:hasWikidataURL ?id .

?instance schema:name ?name .



ORDER BY ?name

Vai al risultato.

Quali di queste hanno il link alla digitalizzazione su Internet Archive e qual è la loro tipologia?

SELECT distinct ?id ?name ?ia ?bibliographicLevel

WHERE {

?instance cobis:hasWikidataURL ?id .

?instance schema:name ?name .

?instance foaf:depiction ?ia .

?instance cobis:bibliographicLevel/rdfs:label ?bibliographicLevel .



ORDER BY ?name

Vai al risultato.

Quante sono le opere del catalogo del CoBiS LOD con voce su Wikidata?

SELECT (count (distinct ?instance) as ?n)

WHERE {

?instance cobis:hasWikidataURL ?id .

?instance schema:name ?name .

?instance foaf:depiction ?ia .

?instance cobis:bibliographicLevel/rdfs:label ?bibliographicLevel .

Vai al risultato.

Opere del catalogo del CoBiS LOD con voce su Wikidata e link alla digitalizzazione disponibile su Internet Archive ordinati per biblioteca

SELECT DISTINCT ?bibliolabel ?instance  ?bibliographicLevellabel ?name ?ia

WHERE

{ ?instance foaf:depiction ?ia .

  ?instance schema:name ?name .

  ?instance cobis:bibliographicLevel ?bibliographicLevel .

MINUS {?instance cobis:bibliographicLevel bibliographicLevel:s}

  ?bibliographicLevel rdfs:label ?bibliographicLevellabel .

  ?instance bf2:hasItem ?item .

  ?item bf2:heldBy ?biblio .

  ?biblio rdfs:label ?bibliolabel .

MINUS {?instance cobis:hasWikidataURL ?wd .}

}

ORDER BY ?bibliolabel

Vai al risultato.

Le query proposte sono state utili per capire come provare a soddisfare qualche curiosità? Prova anche tu a interrogare il catalogo LOD attraverso il punto d’accesso SPARQL.

Per approfondire il tema segui il sito del CoBiS e i nostri canali social.