NOTIZIE IN EVIDENZA

 

VEDI ANCHE...

 

16 luglio 2014

logo SAN

Pubblicate le versioni 1.0 dell'Ontologia SAN LOD e del Thesaurus in formato SKOS del SAN

definite con l’obiettivo di rendere accessibili in formato Linked Open Data i contenuti del Sistema Archivistico Nazionale.

L’Istituto Centrale per gli Archivi rende pubblica la versione 1.0 dell’Ontologia SAN LOD, presentata lo scorso 14 gennaio presso l'Archivio Centrale dello Stato, con la quale si è inteso realizzare un modello concettuale del SAN in formato OWL, esteso attraverso  l’introduzione di classi di oggetti e relazioni tra risorse non previste dalla struttura informativa originaria. Viene reso pubblico anche un Thesaurus SAN in formato SKOS, realizzato come estensione del modello nativo del Sistema per gestire nell’Ontologia i vocabolari controllati previsti dagli schema CAT SAN e insieme fornire all’utenza – grazie all’inserimento di ulteriori schemi di classificazione - uno strumento di supporto alla descrizione normalizzata delle risorse (soggetti produttori, soggetti conservatori, complessi archivistici) provenienti dai diversi sistemi aderenti al SAN.

La rappresentazione HTML dell’Ontologia SAN LOD.1.0 è consultabile all’indirizzo http://www.maas.ccr.it/SAN-LOD/lode/
Una rappresentazione grafica del Thesaurus è raggiungibile all’indirizzo:
È possibile effettuare il download dei file SAN-LOD.v.1.0.owl e Tesauro SAN.v.1.0.rdf agli indirizzi
http://www.san.beniculturali.it/SAN/TesauroSAN.v1.0.rdf  (in questo caso il browser fa scaricare il file rdf).

 

LE FASI DEL PROGETTO 

L’ICAR ha intrapreso un percorso per rendere accessibili i contenuti del Sistema Archivistico Nazionale - SAN in formato Open Data secondo le modalità e le tempistiche  previste dal Decreto Crescita 2.0 convertito nella legge 221/2012.

Un OAI Provider rende accessibili in formato Open Data i contenuti del SAN relativi alle seguenti entità: conservatori di archivi, produttori di archivi, complessi archivistici, strumenti di ricerca, oggetti digitali.
L'OAI Provider rende disponibili metadati in formato XML strutturati secondo i diversi schemi relativi alle entità sopra citate:
·         ead-san (xml): schema XML per la descrizione dei soggetti produttori del SAN
·         eac-san (xml): schema XML per la descrizione dei complessi archivistici del SAN
·         ricerca-san (xml): schema XML per la descrizione degli strumenti di ricerca del SAN
·         scons-san (xml): schema XML per la descrizione dei soggetti conservatori del SAN
·         mets-san (xml): schema XML per la descrizione degli oggetti digitali del SAN
Il set oai disponibile è denominato SAN e permette l’accesso a tutte le informazioni disponibili nel Sistema Archivistico Nazionale attraverso l’indirizzo http://www.san.beniculturali.it/oaicat/
Il protocollo OAI-PMH (Open Archives Initiative Protocol for Metadata Harvesting) è descritto all’indirizzo http://www.openarchives.org/OAI/openarchivesprotocol.html.
Gli schemi XML ead-san, eac-san, ricerca-san, scons-san, mets-san sono descritti nella pagina degli standard del sito dell’Istituto Centrale per gli Archivi all’indirizzohttp://www.icar.beniculturali.it/index.php?it/169/gestione-documentale-e-archivi-storici
Secondo la scala di valutazione dell’apertura e accessibilità dei dati introdotta nel 2006 da Tim Berners Lee, i dati Open Data del SAN attualmente disponibili sono a Tre Stelle in quanto “il dato è disponibile sul web in un formato strutturato non proprietario (xml e xml schema)”.
Alla prima necessaria azione di pubblicazione di Open Data, prevista per tutta la Pubblica Amministrazione nel suo complesso, attraverso un oai provider dei propri dati secondo gli schemi CAT-SAN, l’ICAR ha affiancato un progetto per lo sviluppo e la pubblicazione di Linked Open Data di ambito archivistico centrato sull'individuazione delle diverse entità, i domini di riferimento e la loro rappresentazione in un’ontologia formale.
 
 
 

L’Istituto centrale per gli archivi, con la collaborazione del Centro MAAS – Metodologie e Applicazioni per gli Archivi Storici, ha avviato all’inizio del 2013 un progetto per lo sviluppo e la pubblicazione di Linked Open Data di ambito archivistico. L’iniziativa, i cui primi risultati sono stati presentati in occasione del Forum della Pubblica Amministrazione (28 maggio 2013) e nel corso del seminario “La Storia al tempo degli open data” promosso dalla Società per gli Studi di Storia delle Istituzioni (14 giugno 2013), si è posta come obiettivo di primo livello la definizione di una Ontologia in grado di traslare compiutamente in formato OWL (Ontology Web Language) lo schema concettuale della struttura informativa espressa dai tracciati di scambio CAT SAN (standard di rappresentazione dei dati all’interno del Sistema Archivistico Nazionale).

L’ICAR ha scelto di rappresentare con pienezza espressiva i tracciati CAT SAN nella ontologia, definendo i nomi delle classi di oggetti individuati e le relative proprietà sulla base della nomenclatura da essi adottata, nella convinzione che sia imprescindibile ormai introdurre anche nell’ambiente Linked Open Data concetti e terminologia pienamente rappresentativi dello specifico apportato dalla disciplina archivistica. L’apertura – essenziale per l’inserimento nella nuvola LOD - verso ontologie di larghissima diffusione nell’ambito del cosiddetto cultural heritage, ma certamente in assoluto non adeguate a veicolare pienamente la semantica affidata al metadato archivistico, è tecnologicamente realizzabile affidandosi a formalismi del linguaggio OWL che definiscono corrispondenze semantiche quali ad es. il costrutto owl:sameAs, raggiungendo così l’obiettivo di collegare informazioni provenienti da fonti multiple e generare inferenze logiche senza sacrificare ad esso l’integrità del modello concettuale nativo.
 
Il rispetto filologico dei tracciati originari è apparso essere un criterio metodologico ineludibile nella definizione di una ontologia del Sistema Archivistico Nazionale, poiché essi veicolano – condizione necessaria nella definizione di una ontologia di dominio - una conoscenza consensuale, frutto, nel 2009, di un lungo ed elaborato percorso di confronto tra i membri della Sottocommissione tecnica per la definizione dei metadati relativi alle risorse archivistiche rese accessibili attraverso il Sistema Archivistico Nazionale, scelti in rappresentanza dell'Amministrazione archivistica, delle Regioni e di altri soggetti operanti nel campo della realizzazione di sistemi informativi archivistici. È sembrato cioè doveroso valorizzare i risultati raggiunti da tale attività, condivisa da spaccati significativi della comunità archivistica nazionale, arricchendoli - laddove la messa in esercizio del SAN ha evidenziato delle possibili aree di intervento migliorativo - senza tuttavia snaturarne l’intento programmatico di strutture informative nate per descrivere le principali entità coinvolte nella descrizione archivistica, in perfetta coerenza scientifica con le indicazioni sugli standard di dominio adottati a riferimento.
 
Nell’ambito della riflessione intrapresa all’interno del progetto è emersa rapidamente la opportunità di definire, rispetto ad una Ontologia di base, una serie di estensioni, tali da consentire l’integrazione di entità e relazioni tra oggetti non previste dagli schema proposti come tracciato di scambio e pertanto attualmente non presenti all’interno del SAN, ma residenti nei sistemi di provenienza o in altre autorevoli fonti esterne individuate, non necessariamente di natura archivistica. L’ampliamento della struttura informativa originaria del SAN, realizzato attraverso la rappresentazione in formato OWL di un modello esteso, appare quindi orientata ad una duplice finalità: aggregare nella versione Linked Open Data del SAN risorse descritte con maggiore aderenza alla ricchezza strutturale propria dei sistemi aderenti, e insieme potenziare la visibilità e la portata informativa di tali risorse aggregate attraverso un’attività di linking esterno (interlinking) alle ontologie principali della nuvola LOD (Dbpedia, Geonames, etc.) per le operazioni di riconciliazione necessarie alla loro integrazione in ambiente Linked Data.
Particolare attenzione è stata prestata inoltre ad identificare nell’ambito di ontologie (FOAF - Friend of a Friend) o formati di scambio (Dublin Core) estremamente diffusi, i punti di raccordo con gli elementi descrittivi essenziali del modello elaborato. In questa fase operativa sono state introdotte anche corrispondenze semantiche con le ontologie pubblicate all’interno del Progetto RELOAD - Repository for Linked open archival data, iniziativa nazionale che ha affrontato – con sostanziali differenze rispetto all’esperienza condotta per il modello SAN, essenzialmente riconducibili ai diversi obiettivi dichiarati dai due progetti e ai rispettivi contesti di applicazione - analoghe problematiche descrittive in ambito archivistico.
 
Il progetto è giunto in questi giorni alla fase di rilascio di una versione 1.0 della ontologia SAN-LOD.owl, nella quale risultano già presenti la maggior parte delle estensioni alla ontologia di base previste. La pubblicazione ufficiale di una versione 1.0 della ontologia complessiva SAN-LOD è stata presentata nel corso di un evento pubblico svoltosi lo scorso 14 gennaio 2014 presso l'Archivio Centrale dello Stato.
 
Le risorse SAN risulteranno ulteriormente potenziate dalla realizzazione di una lista di autorità di toponimi su scala nazionale, basata principalmente sulla rielaborazione in formato LOD di dati istituzionali (fonte ISTAT per il periodo postunitario) integrabili con fonti di particolare rilevanza storica; tale lista sarà raccordata - in fase sperimentale - coi dati SAN LOD di provenienza Sistema Guida Generale. Questa operazione si configura come una ulteriore estensione della ontologia di base SAN, che immette nel sistema nuova “conoscenza” attraverso l’integrazione di un repertorio di informazioni storico-geografiche di estrema rilevanza per l’ampliamento della portata informativa dei dati archivistici, che viene messo a disposizione della comunità archivistica nazionale come strumento di riferimento per qualunque futura operazione descrittiva che coinvolga la dimensione storico-geografica.
Il rilascio della lista di autorità dei toponimi storici procederà di pari passo con l’ultimo passaggio progettuale previsto, la realizzazione di un endpoint sparql per la pubblicazione e l’interrogazione dell’ontologia e dei datasets SAN resi disponibili in formato LOD, che avrà termine entro il giugno 2014.
 
Obiettivo complessivo del progetto, in coerenza con il mandato istituzionale dell’Istituto, è stata pertanto la definizione di una ontologia estesa che modelli l’intero schema concettuale del SAN integrandolo con entità ed elementi informativi di cui è emersa in corso d’opera la rilevanza, mantenendo una perfetta coerenza scientifica con le indicazioni sugli standard di dominio adottati dalla Sottocommissione tecnica sopra citata.
 
L’ontologia di base realizzata ha fatto emergere dall’analisi dei tracciati di scambio le seguenti classi OWL: il complesso archivistico (classe SAN:complarc), lo strumento di ricerca (classe SAN:strumento), il soggetto produttore (classe SAN:produttore, articolata in tre sottoclassi SAN:ente, SAN:famiglia, SAN:persona) e il soggetto conservatore (modellato rispetto alla dimensione effettivamente rappresentata nel Sistema di ‘soggetto conservatore d’autorità’: classe SAN:sconsAuthority).
 
 
 
Nella attuale versione 1.0 il modello di base è stato esteso con l’inserimento di due ulteriori classi di oggetti: SAN:profilo Istituzionale e SAN:CSI; si è deciso, nel primo caso, di dare autonoma rilevanza ad un’entità contemplata negli schema CAT SAN soltanto come possibile istanza (qualificata da un attributo) del tipo record “soggetto produttore”. Il contesto storico istituzionale
è stato invece introdotto ex novo come oggetto logico autonomo, in quanto presente in alcuni sistemi di provenienza dove costituisce un fondamentale supporto informativo rispetto al contesto di produzione della documentazione, che individua e descrive collocandola nello spazio e nel tempo l’organizzazione istituzionale entro cui ha operato il soggetto produttore.
 
 
 
È stato inoltre integrato nell’ontologia l’elemento Tematismo, attributo qualificante dei complessi archivistici presente in un sistema di provenienza (SIAS), che si è ritenuto utile introdurre nel SAN LOD come estensione del modello originario, allo scopo di offrire una chiave di classificazione e di accesso tematica alla documentazione. La classe Tematismo (un vocabolario composto da 41 voci tematiche), allo stesso modo di tutti i vocabolari controllati previsti dallo standard CAT SAN (Sottotipologie del Soggetto produttore Ente, Tipologia della data di esistenza del soggetto produttore, Estensione alla data del complesso archivistico, Tipologia della qualifica associata al soggetto produttore, Status della scheda nel sistema di provenienza, Tipologia conservatore) sono stati elaborati come altrettanti concept-schema SKOS (Simple Knowledge Organisation System) opportunamente integrati nell’ontologia OWL.
 
La decisione di dare ai vocabolari controllati una propria definizione autonoma come schemi di classificazione SKOS, offerti quindi, al di fuori delle finalità SAN LOD, in un formato aperto, flessibile e facilmente implementabile, si inserisce in una logica di produzione di ausili e strumenti per la standardizzazione delle voci descrittive che l’ICAR intende perseguire ad uso della comunità archivistica.
 
 

 

 

Per un approfondimento cfr.:

Fonte

istituto centrale per gli archivi - icar

Tipologia

notizia