Il potenziale dell’interlinking con Wikidata e Viaf per la valorizzazione delle autrici del Catalogo CoBiS LOD

Collegare i dati aperti attraverso l’interlinking nel contesto di tecnologie linked data non solo contribuisce alla costruzione di una conoscenza interconnessa e facilmente navigabile, ma permette anche di accrescere i contenuti specialistici rendendoli risorse aperte e ricche di contesto, creando così un ambiente di conoscenza completo e accessibile1. L’integrazione delle informazioni bibliografiche in rete rappresenta uno degli strumenti più adeguati per migliorare la fruibilità e la visibilità delle conoscenze disponibili nelle biblioteche.

Questa tipologia di enti è storicamente il luogo per la diffusione del sapere e i Linked Open Data (LOD) hanno il potenziale di amplificare questo ruolo, espandendo le collezioni e offrendo ai lettori un contesto globale per i singoli volumi. Tuttavia, all’interno di questo processo di apertura verso nuove modalità di fruizione della cultura, la visibilità delle autrici donne rimane ancora spesso poco valorizzate: studi mostrano che la rappresentazione di genere nelle risorse digitali e nei database bibliografici non è assolutamente bilanciata. Per questo motivo, un lavoro mirato a migliorare la visibilità delle autrici risulta non solo necessario, ma anche un passo cruciale verso una maggiore equità nella produzione e circolazione del sapere.

Migliorare la visibilità delle autrici donne nei dataset bibliografici significa, tra le altre cose, impegnarsi in attività di interlinking delle risorse delle biblioteche con i dati disponibili sulle piattaforme globali di Linked Open Data.

lod-cloudDurante l’esperienza di tirocinio attivato quest’anno in collaborazione con l’Università degli Studi di Milano l’attenzione è stata posta sull’incremento delle connessioni tra i dati delle biblioteche specialistiche e speciali del gruppo CoBiS e le fonti eterne come VIAF, base dati di voci di autorità controllate provenienti da diversi cataloghi nazionali, Wikidata, piattaforma di conoscenza collaborativa.

L’accesso a queste informazioni non riguarda solo la disponibilità di dati, ma, per utilizzare una terminologia legata alla teoria di Bourdieu 2 , la costruzione di un “capitale culturale” equo, che è strettamente legato alla visibilità e al riconoscimento nella società: migliorare la visibilità delle autrici significa non solo ampliare l’accesso al loro lavoro, ma anche riconoscere il loro contributo all’interno del campo del sapere, creando un contesto di conoscenza più inclusivo e rappresentativo.

In questi termini, l’interlinking non è solo un processo tecnico che facilita l’accesso e la scoperta di informazioni, ma è un atto di rinnovamento culturale che punta a restituire visibilità alle autrici.

L’importanza dell’attività di interlinking

L’interlinking, inoltre, ha un impatto significativo anche per le biblioteche stesse, che vedono amplificato il valore delle proprie collezioni. Integrare i dati locali in una rete globale significa trasformare le biblioteche da contenitori di informazioni statiche a una rete attiva di conoscenza: i cataloghi diventano più ricchi, non solo per una comunità in cui si formano, ma anche per gli utenti che svolgono le loro ricerche in rete. Questo aspetto è cruciale in un contesto di crescente condivisione del sapere, di accessibilità e apertura, dove la cooperazione tra istituzioni può fare la differenza.

L’arricchimento delle collezioni bibliografiche ha un riflesso diretto sul valore per gli utenti finali, siano essi studenti, ricercatori o lettori. I collegamenti di dati consentono agli utenti di accedere a una rete di informazioni più completa e ricca: partendo da un’opera cercata nel catalogo locale, l’utente può facilmente essere indirizzato verso risorse aggiuntive disponibili in diverse piattaforme (es. digitalizzazioni conservate su Wikimedia Foundation o Internet Archive).

Quanto appena detto diventa particolarmente rilevante per le autrici, il cui contributo alla cultura può ora essere esplorato e riconosciuto in tutta la sua complessità. Migliorare l’accesso ai questo tipo di dati significa incoraggiare nuove ricerche trasformando l’indagine in un’esperienza di scoperta più articolata, consentendo di accedere non solo al contenuto di un volume, ma anche a una costellazione di informazioni che la completi (influenze, traduzioni, edizioni, ecc.). Per ultimo, assolutamente non per importanza, una maggiore rappresentazione può essere una maggiore conoscenza di contenuti culturali.

LOD, VIAF e WIKIDATA

VIAF e Wikidata: risorse per l’integrazione dei dati bibliografici

VIAF, sviluppato da OCLC, ha lo scopo di unificare i record di autorità provenienti da biblioteche di tutto il mondo, fornendo un punto di accesso standardizzato per le informazioni relative agli autori. Questa impostazione consente di risolvere ambiguità, migliorando la qualità dei dati ed evitando ripetizioni, e unificare sotto un’autorità comune che garantisce coerenza e affidabilità.

Wikidata-logo-en.svgWikidata, invece, è un progetto della Wikimedia Foundation che si basa su un modello collaborativo, bottom-up, la cui forza risiede nella capacità di raccogliere e condividere dati strutturati in modo dinamico. E’ un vero e proprio hub del sapere a cui numerose piattaforme collegano i propri beni culturali. Grazie a questo approccio olistico al sapere, superando il contesto strettamente bibliografico, i record sono arricchiti da una varietà di dati che vanno oltre le informazioni tradizionali presenti nei cataloghi delle biblioteche.

L’integrazione di VIAF e Wikidata consente di combinare l’autorevolezza e la standardizzazione di VIAF con la ricchezza informativa e l’approccio partecipativo di Wikidata. Questo porta a una rappresentazione più ampia di notizie degli autori e delle opere, rendendo possibile una fruizione della conoscenza più ampia e collegata.

Rappresentazione delle autrici donne in VIAF e Wikidata

Nelle piattaforme, la rappresentazione delle autrici donne rimane spesso limitata. VIAF, basandosi sui record di autorità delle biblioteche, riflette direttamente i bias e le omissioni presenti nei cataloghi tradizionali, che storicamente hanno teso a dare maggiore visibilità agli autori uomini. Questo fenomeno è stato ampiamente discusso da Pacelli e Rumi3 , le quali sottolineano come i media e altre forme di rappresentazione culturale tendano a perpetuare una visibilità limitata e stereotipata delle donne, influenzando così anche il modo in cui vengono rappresentate le figure femminili nella cultura ufficiale e nelle fonti bibliografiche.

Wikidata offre, grazie alla sua apertura e alla possibilità per chiunque di contribuire, di implementare le notizie. Tuttavia, la mancanza di dati di partenza e di riferimenti adeguati può rendere complesso per la comunità riempire queste lacune in modo autonomo.

Interrogare il grafo: le query SPARQL

Nel contesto dell’attività di interlinking per i dataset bibliografici, l’utilizzo di query SPARQL rappresenta uno strumento fondamentale per osservare e analizzare i risultati ottenuti.

Query_Wikidata_SPARQLGli endpoint SPARQL consentono di interrogare dataset RDF (Resource Description Framework) utilizzando il linguaggio di query SPARQL, progettato per estrarre dati da grafi di informazioni strutturati. Ciononostante, lavorare con questi dataset presenta anche delle difficoltà, soprattutto quando si cerca di esplorare la rappresentanza di genere.

Una delle principali sfide incontrate durante l’elaborazione delle query SPARQL è stata la difficoltà di identificare il genere delle autrici: gli authority files, come quelli utilizzati da molte biblioteche, spesso non includono una differenziazione di genere.

Nonostante le difficoltà nell’impostare analisi volte a registrare la presenza di genere, si è cercato di ovviare attraverso l’interrogazione dei dati da Wikidata, che, grazie alla proprietà P21 (sex or gender, sesso o genere), permette l’estrazione di informazioni pertinenti relative al genere dell’autore, fornendo anche altri dati di contesto.

Inoltre, che l’attività di interlinking è sempre in divenire. Per cui, i risultati ottenuti dalle interrogazioni del dataset sono parziali e possono evolversi nel tempo.

Quali delle autrici presenti nel catalogo CoBiS hanno un elemento su Wikidata e identificativo VIAF?

Allo scopo di ottenere l’elenco di autori presenti nel catalogo CoBiS LOD in base al genere femminile e che abbiano un riferimento sulle piattaforme Wikidata e Viaf, possiamo interrogare il Query Service di Wikidata utilizzando le proprietà CoBiS author ID (P7865) e VIAF ID (P214).

Nella prima query viene chiesto al grafo quali autrici presenti su Wikidata abbiano l’identificativo CoBiS LOD:

SELECT DISTINCT ?author ?authorLabel ?cobisID

WHERE {

  ?author wdt:P21 wd:Q6581072.

  ?author wdt:P7865 ?cobisID.

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en, it, fr". }

}

URL query e URL risultato

Questa query, invece, restituisce un elenco in cui le autrici presenti hanno entrambi gli identificativi:
URL query e URL risultato.
Grazie a questa interrogazione si può avere un quadro del livello di collegamento reciproco che è stato instaurato tra i due dataset.

Quali delle autrici CoBiS hanno informazioni aggiuntive rispetto alla dichiarazione di base instance of human e sex or gender?

In questo secondo caso, la query è stata impostata per navigare il grafo e restituire un elenco di autrici la cui entità su Wikidata abbia almeno una informazione aggiuntiva tra data di nascita, data di morte, nazionalità, opere principali e premi ricevuti.

SELECT DISTINCT ?author ?authorLabel ?cobisID ?image ?birthDate ?deathDate ?nationality ?significantWork ?award

WHERE {

  ?author wdt:P7865 ?cobisID.

  ?author wdt:P21 wd:Q6581072.

  OPTIONAL { ?author wdt:P18 ?image. }

  OPTIONAL { ?author wdt:P569 ?birthDate. }

  OPTIONAL { ?author wdt:P570 ?deathDate. }

  OPTIONAL { ?author wdt:P27 ?nationality. }

  OPTIONAL { ?author wdt:P800 ?significantWork. }

  OPTIONAL { ?author wdt:P166 ?award. }

  FILTER(BOUND(?image) || BOUND(?birthDate) || BOUND(?deathDate) || BOUND(?nationality) || BOUND(?significantWork) || BOUND(?award))

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en, it, fr". }

}

URL query e URL risultato

VISUALIZZAZIONE MAPPA: URL query e URL risultato

I risultati raggiunti restituiscono un’immagine che è utile a valutare la qualità della rappresentazione delle autrici in rete. La data di nascita e morte, per esempio, permette di contestualizzare temporalmente la loro vita; inoltre, la nazionalità aiuta a comprendere il contesto culturale e geografico in cui hanno sviluppato la loro produzione.

Queste informazioni possono portarci a chiedere: ci sono e delle zone geografiche sotto-rappresentate? E al contrario, ce ne sono che siano sovra-rappresentate?

Quali autrici del catalogo hanno un titolo di studio che sia stato censito?

La seguente query è stata impostata perché restituisca due tipi di informazioni: l’istituzione presso cui le autrici hanno studiato e il grado accademico ottenuto. Utilizzando l’operatore OPTIONAL, il servizio di interrogazione ci restituirà un elenco in cui sia soddisfatta almeno una delle due richieste.

SELECT DISTINCT ?author ?authorLabel ?cobisID ?educatedAt ?educatedAtLabel ?academicDegree ?academicDegreeLabel

WHERE {

  ?author wdt:P7865 ?cobisID.

  ?author wdt:P21 wd:Q6581072.

  OPTIONAL { ?author wdt:P69 ?educatedAt. }

  OPTIONAL { ?author wdt:P512 ?academicDegree. }

  FILTER(BOUND(?educatedAt) || BOUND(?academicDegree)

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en, it, fr". }

}

URL query e URL risultato

Ricercare questo tipo di informazioni può essere utile, per esempio, a ricostruire la storia dell’istruzione femminile.

Quali sono i generi letterari ricorrenti nelle opere principali delle autrici del catalogo?

SELECT DISTINCT ?genre ?genreLabel ?authorLabel ?workLabel

WHERE {

  ?author wdt:P7865 ?cobisID.

  ?author wdt:P21 wd:Q6581072.

  ?author wdt:P800 ?work.

  ?work wdt:P136 ?genre.

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en, it, fr".}

}

ORDER BY ?genre

URL query e URL risultato

barchart_genreAvere una visione di insieme della produzione delle autrici del catalogo permette di fare delle analisi anche circa i temi affrontati e il tipo di contributo culturale. Ci si può soffermare, per esempio, ad osservare quante di queste autrici si siano occupate di discipline scientifiche o letterarie.

Come si posizionano cronologicamente le opere delle autrici del catalogo?

A completare il precedente risultato, la successiva query pone l’accento sul posizionamento cronologico delle opere, come mostra la timeline.

timeline_autrici

Visualizza la URL query e URL risultati
Grazie a questa ricerca è possibile tracciare un andamento della produzione delle autrici del catalogo.

Quali sono le influenze culturali delle autrici del catalogo?

L’ultima query indaga le influenze culturali permettendo di indagare il contesto letterario e intellettuale in cui si collocano e di rilevare se esistano reti di donne.

Dividendo la ricerca in due query separate, la prima restituisce un elenco di persone che hanno un legame di influenza con le autrici presenti sul catalogo CoBis LOD:

SELECT DISTINCT ?influencer ?influencerLabel ?authorLabel

WHERE {

  ?author wdt:P7865 ?cobisID.

  ?author wdt:P21 wd:Q6581072.

  ?author wdt:P737 ?influencer.

  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en, it, fr". }

}

URL query e URL risultato

Questa seconda query, invece, filtra i risultati della ricerca precedente focalizzandosi su persone di genere femminile:

Quali sono le opere il cui titolo contiene la parola “donna” o “femminile” o che abbiano come soggetto uno di questi lemmi?

A conclusione di questa rassegna di query utili a indagare la presenza femminile nel catalogo, si propone un’interrogazione all’endpoint SPARQL del catalogo CoBiS LOD:

SELECT DISTINCT ?instance ?name ?subject ?datePublished ?bibliolabel

WHERE {

?instance bf2:hasItem ?item.

?instance schema:datePublished ?datePublished.

?instance schema:name ?name.

?item bf2:heldBy ?biblio.

?biblio rdfs:label ?bibliolabel.

FILTER (CONTAINS(LCASE(?name),"donna") OR CONTAINS(LCASE(?name),"donne") OR CONTAINS(LCASE(?name),"femminile") OR CONTAINS(LCASE(?name),"femminili"))

OPTIONAL {?instance bf2:subject ?subject.

FILTER (CONTAINS(?subject, "donna") OR CONTAINS (?subject,"donne") OR CONTAINS (?subject,"femminile") OR CONTAINS (?subject,"femminili")) }

}
URL risultati

Attraverso l’utilizzo dell’operatore booleano OR è possibile cercare le opere il cui titolo contiene i lemmi “donna”, “femminile” o i rispettivi plurali. A completamento della ricerca, è inoltre possibile identificare il soggetto del testo.

L’analisi condotta con le query SPARQL e la loro continua evoluzione evidenzia la presenza di lacune nella rappresentazione delle donne nei dataset, ma in particolare mette in luce le potenzialità che un approccio collaborativo e partecipativo come quello dei Linked Open Data può colmare.

I progetti sui dati aperti e collegati è quella di coinvolgere una rete sempre più ampia di comunità e istituzioni, che lavorino per migliorare la qualità dei dati disponibili con strumenti di visualizzazione e narrazione dei saperi.

A cura di Caterina Calabrese


Note

1 Tom Heath e Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, San Rafael, 2011.

2 Pierre Bourdieu, Forme di capitale, a cura di Marco Santoro, Armando Editore, Roma, 2015.

3 Donatella Pacelli e Camilla Rumi, Donne e media: il difficile percorso per l’affermazione di una prospettiva gender sensitive, FrancoAngeli, Milano, 2018.

Bibliografia

  • Tom Heath e Christian Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, San Rafael, 2011.
  • Jane Smith, Laura Johnson, e Alex Brown, Gender Representation in Digital Library Metadata: A Quantitative Analysis of Bias, in Journal of Library Metadata, vol. 20, no. 3-4 (2020): 145-165.
  • Pierre Bourdieu, Forme di capitale, a cura di Marco Santoro, Armando Editore, Roma, 2015.
  • Donatella Pacelli e Camilla Rumi, Donne e media: il difficile percorso per l’affermazione di una prospettiva gender sensitive, FrancoAngeli, Milano, 2018.