Svolgere una ricerca bibliografica sul tema della salute interrogando il catalogo CoBiS LOD

Fruto_de_la_mandrágora_(Tacuinum_Sanitatis)

Fruto de la mandrágora (Tacuinum Sanitatis)

Nel contesto del tirocinio CoBiS LOD, abbiamo svolto una ricerca bibliografica nel portale CoBiS LOD e tramite query SPARQL sul tema della salute, con particolare riguardo alla sanità pubblica. Consultando in un primo momento il Thesaurus del Nuovo Soggettario abbiamo individuato termini associati alla parola salute e selezionato “igiene” e “sanità”.

L’utilizzo di chiavi di ricerca selezionate ci permette di esplorare quanto posseduto su un tema specifico dalle dodici biblioteche del progetto CoBiS LOD e di individuare opere digitalizzabili.

I principali obiettivi che ci siamo posti sono stati:

  • ricercare edizioni presenti nel catalogo CoBiS LOD, su un determinato argomento, attraverso l’utilizzo di specifiche chiavi di ricerca, presenti nel titolo e nel soggetto, utilizzare il troncamento, gli operatori booleani e lingue differenti;
  • individuare opere di cui è già presente una digitalizzazione o selezionare potenziali volumi da digitalizzare;
  • identificare voci da creare o implementare su Wikidata.

Per svolgere la ricerca abbiamo seguito due diverse modalità: tramite ricerca libera nel portale Cobis LOD, grazie alla barra di ricerca del portale, e tramite l’utilizzo di query attraverso l’endpoint SPARQL del CoBiS.

La ricerca sul portale

Abbiamo iniziato la nostra analisi inserendo singolarmente nella buca di ricerca i termini “salute” “igiene” e“sanità”.

Per ottenere un maggior numero di risultati comprensivi delle variazioni dei termini selezionati, abbiamo ripetuto la ricerca utilizzando il troncamento e un asterisco * finale (ad esempio salut*, igien*, sanit*).

colonie marine

La foto raffigura bambini in una colonia marina negli anni ’50 e proviene dall’archivio dell’Istituto Salvemini, Fondo UIL Piemonte

Effettuando la ricerca sul portale i risultati vengono automaticamente ordinati per rilevanza, tuttavia è possibile selezionare un ordine per data o alfabetico. Grazie alla barra laterale presente sulla destra (autore, data, editore, tipologia, natura, biblioteca, lingua, digitalizzazioni) è possibile filtrare ulteriormente i risultati.

Ad esempio, aprendo le schede delle opere con digitalizzazioni, è possibile consultare la relativa digitalizzazione presente su Internet Archive. In questo  caso le diverse modalità di ricerca ci hanno restituito pochi risultati relativi ad opere digitalizzate, un importante indizio per procedere con la selezione di volumi da digitalizzare in questo specifico campo di interesse.

Nel caso in cui volessimo individuare opere da digitalizzare, potremmo scegliere un ordinamento per data (dal meno recente) e restringere la ricerca a una specifica biblioteca.

Un’altra modalità che ci consente di ampliare o restringere il numero dei risultati è l’utilizzo degli operatori booleani. Inserendo, ad esempio, tra le parole scelte l’operatore OR (oppure)

salute OR igiene OR sanità

otteniamo un elenco di risultati il cui titolo contiene almeno uno dei termini indicati, che possiamo poi filtrare selezionando una specifica data tramite i filtri disponibili lateralmente.

Possiamo ulteriormente estendere la ricerca scrivendo:

salut* OR igien* OR sanit*

ricerca con operatori booleaniAprendo una particolare edizione veniamo reindirizzati a una scheda con le principali informazioni sull’opera: la descrizione bibliografica, il link all’OPAC, le biblioteche che ne conservano delle copie e, in caso di opera digitalizzata, il collegamento alla digitalizzazione disponibile su Internet Archive.

Potenzialità e limiti della ricerca sul portale CoBiS LOD

La ricerca libera sul portale CoBiS LOD offre la possibilità di consultare contemporaneamente il patrimonio delle biblioteche aderenti al progetto, incrementando le voci degli autori collegati con informazioni esterne.

Scheda autore

La ricerca con query tramite endpoint SPARQL

Per approfondire l’analisi effettuata dal portale, abbiamo impostato delle query SPARQL per interrogare i dati tramite l’end point Virtuoso, ma per una visualizzazione semplificata abbiamo utilizzato Yasgui che mantiene i risultati nella stessa schermata e distingue gli elementi di una query in diversi colori, utile per chi è alle prime armi.
Attraverso le query SPARQL è possibile ottenere risultati incrociati basati sulla ricerca dei termini sia nel titolo sia nel soggetto. Con questa modalità di ricerca, i risultati ottenuti potranno poi essere scaricati in un formato CSV.
Abbiamo impostato questa prima query per individuare nel titolo delle edizioni sia il termine “salute” sia “igiene” e per individuare le edizioni che riportano nel campo soggetto il termine “salute”.

SELECT DISTINCT ?instance ?name ?datePublished ?bibliolabel
WHERE {
?instance bf2:hasItem ?item .
?instance schema:datePublished ?datePublished .
?instance schema:name ?name . 
?item bf2:heldBy ?biblio .
?biblio rdfs:label ?bibliolabel .
FILTER (CONTAINS(LCASE(?name), "salute"))
FILTER (CONTAINS(LCASE(?name), "igiene"))
OPTIONAL {?instance bf2:subject ?subject .
FILTER (CONTAINS(?subject, "salute")) }
}
ORDER BY ?bibliolabel

I risultati di questa ricerca sono ordinati per collocazione (clicca qui per visualizzare la query e i risultati).

Invece, per individuare nel titolo delle edizioni il termine “salute” o “igiene” o “sanità” o “igienico” o “sanitario” con l’operatore booleano OR, da cercare opzionalmente anche nel soggetto:

SELECT DISTINCT ?instance ?name ?datePublished ?subject ?bibliolabel
WHERE {
?instance bf2:hasItem ?item .
?instance schema:datePublished ?datePublished .
?instance schema:name ?name .
?item bf2:heldBy ?biblio .
?biblio rdfs:label ?bibliolabel .
FILTER (CONTAINS(LCASE(?name),"salute") OR CONTAINS(LCASE(?name),"igiene") OR CONTAINS(LCASE(?name),"sanità") OR CONTAINS(LCASE(?name),"igienico") OR CONTAINS(LCASE(?name),"sanitario"))
OPTIONAL {?instance bf2:subject ?subject .
FILTER (CONTAINS(?subject, "salute") OR CONTAINS (?subject,"igiene") OR CONTAINS (?subject,"sanità") OR CONTAINS (?subject,"medicina")) }
}
ORDER BY ?bibliolabel

Clicca qui per visualizzare la query e i risultati.

Il Tesoro della Sanità

Il Tesoro della Sanità

Per individuare la tipologia bibliografica, la lingua e anche quali edizioni hanno una digitalizzazione disponibile, abbiamo impostato una query che restituisce i risultati ordinati per data di pubblicazione (clicca qui per visualizzare la query e i risultati).

La query restituisce le edizioni che riportano i termini “salute”, “igiene” e “sanità” sia nel titolo sia nel soggetto, ma anche l’eventuale restituzione dell’elenco completo dei link alle digitalizzazioni disponibili per ogni edizione (ad esempio questo Manuale d’igiene e medicina navale).

Come effettuare la ricerca di opere in pubblico dominio

Nel caso in cui volessimo individuare opere da digitalizzare, rispetto alla ricerca sul portale, con le interrogazioni SPARQL è possibile filtrare le edizioni in base alla data di morte degli autori e dei curatori, restringendo i risultati alle sole edizioni entrate in pubblico dominio in quanto trascorsi 70 anni dalla morte dell’autore.

Per raggiungere l’obiettivo di individuare opere digitalizzabili esistono diverse possibili strategie come interrogare i dati del catalogo utilizzando la proprietà schema:deathDate o impostando una ricerca su Wikidata filtrando i risultati in base alla proprietà ID CoBiS di un autore per scoprire altre edizioni disponibili.
Nel primo caso possiamo interrogare i dati del catalogo dall’endpoint cercando le edizioni di autori per cui è disponibile la data di morte e che sia maggiore di 70 anni.

Clicca qui per visualizzare la query e i risultati.

Nel secondo caso, si potrebbe impostare una ricerca di tutte le opere disponibili su Wikidata di autori con ID CoBiS di un autore e una data di morte (proprietà P570) > 70 anni.

42-aspetti_di_vita_quotidiana,_medicine,_Taccuino_SanitatisSi può aggiungere alla ricerca di restituire tra i risultati l’eventuale link alla digitalizzazione su Internet Archive o Wikimedia Commons.

Visualizza la ricerca e confronta i risultati con le edizioni disponibili sul catalogo CoBiS LOD.

Ovviamente, i risultati tengono conto solo degli autori per cui sono disponibili i dati relativi alla data di morte e collegati tramite ID CoBiS di un autore; a tale scopo, è auspicabile che i bibliotecari collaborino all’arricchimento delle voci Wikidata per godere del lavoro svolto con l’aumento dei collegamenti sul portale e facilitare particolari ricerche bibliografiche sfruttando le potenzialità dei Linked data.

Potenzialità e limiti delle ricerche tramite query

Le query permettono di incrociare i dati del catalogo CoBiS con quelli di basi di dati esterne, ad esempio Wikidata. Inoltre, la possibilità di selezionare quali informazioni ottenere e in che ordine, come la data di nascita di un autore, i curatori o l’ordinamento per biblioteche, rappresenta un valido supporto nei casi in cui si debbano effettuare ricerche per determinate finalità. Ad esempio, la selezione di volumi da digitalizzare o l’individuazione di particolari tematiche comuni tra le collezioni delle biblioteche, possono rivelarsi utili a progetti di valorizzazione del patrimonio.
In virtù di queste potenzialità, la possibilità di scaricare i risultati ottenuti (funzione non presente sul portale) permette di facilitare il lavoro di analisi dei risultati.
Come abbiamo avuto modo di constatare, altra potenzialità delle query, assente nella ricerca sul portale, è la possibilità di ricercare le edizioni per soggetto. Anche se in questo caso ci sono dei limiti perché non tutte le edizioni sono soggettate dagli enti, quindi la ricerca è parziale.
Inoltre, i soggetti presenti sul portale sono tratti dall’indice SBN, quindi spesso potrebbero non coincidere con quelli che le singole biblioteche inseriscono in locale.

Eventuali sviluppi della ricerca

Dalla ricerca svolta emerge che attualmente sono disponibili digitalizzazioni in numero limitato per le edizioni individuate con le chiavi di ricerca selezionate, ma sono state anche individuate edizioni in pubblico dominio per cui è possibile attuare l’integrazione.

Un altro possibile sviluppo consisterebbe nell’implementare la ricerca iniziale con termini più specifici, in modo da far emergere percorsi di ricerca particolarmente interessanti e caratteristici per i diversi istituti. Affiancando, ad esempio, ai termini selezionati inizialmente, altri termini emersi tra i soggetti delle edizioni analizzate, come le parole “malattie”, “lavoro” o “psicologia”, restringendo o ampliando i risultati delle query SPARQL in base alle informazioni che si intendono estrarre.

Relazione a cura di Irene Piergentili