torsdag 31 januari 2013

Länkad öppen data-workshop på Riksarkivet

Förra veckan (21 - 25 januari) hölls en workshop på temat öppen länkad data på Riksarkivet i Marieberg. Det hela sparkades igång på måndagen med att riksarkivarie Björn Jordell hälsade alla välkomna. Öppen data-evangelisten Peter Krantz berättade för en fullsatt hörsal vad öppen länkad data är och varför det är bra (Peters presentation finns här).

Peter Krantz visar den femstjärniga modellen för öppen data.

Personal från Kungliga biblioteket, Riksarkivet och Riksantikvarieämbetet arbetade tillsammans under veckan med att öppna och länka samman dataset som är av stort intresse också för många aktörer utanför de tre myndigheterna. Det dataset som det fokuserades mest på var auktoritetsposter (uppgifter om personer och organsiationer) från Riksarkivets NAD och ARKIS.

Arbetet tog avstamp från de poster som fanns både hos KB, RAÄ och RA. Man fokuserade på personposter eftersom dessa ofta är lättare att matcha mot varandra än t ex platser. "Sven Hedin" på Riksarkivet kan enkelt matchas och identifieras som samma person som KBs "Sven Hedin".

Rent praktiskt innebar det bl a att några aukoritetsposter för kända personer länkades till så kallade URIer. En URI är en kodsträng som identifierar en unik resurs. Två stora URI-källor är VIAF och DBPedia. Om vi fortsätter med exemplet "Sven Hedin" så är NADs post om Sven numera länkad till DBPedias Sven Hedin-URI. Till DBPedia pekar redan ett stort antal länkar från andra öppna datakluster. Genom DBPedia är man säker på att det är samma "Sven Hedin" som andra som länkat till posten avser.

Under veckan så identifierade man också vilka olika typer av auktoriteter som Riksarkivet har, och man tilldelade dessa typer lämpliga kodspråk, s k ontologier. För auktoritetstypen personer använde man ontologin FOAF (Friend Of A Friend - beskriver personer, deras aktiviteter, och hur de förhåller sig till andra personer och objekt). Förutom FOAF användes SKOS för att beskriva ämnesord och hierarkier, Dublin Core för allmänna bibliografiska begrepp, samt DBPedias egen ontologi för att med dess generella klasser och begrepp beskriva ytterligare detaljer, såsom födelseår och platser.

Matchning av RAs auktoritetstyper med lämpliga ontologier.

Det sattes även upp SPARQL-endpoints till den länkade data från RA som skapats under veckan, samt till RAÄs redan publicerade öppna data. En SPARQL-endpoint låter andra få åtkomst till datat så att t ex samsökningar i många datalager går att göra utan att först behöva importera/aggregera allt till en och samma databas.

Veckan avslutades på fredagen inför en åter smockfull åhörarsal med att Martin Malmsten presenterade vad som hade åstadkommits. Riksarkivarien och riksbibliotekarien var på plats, riksantikvarien hade representation närvarande. Alla tre var eniga om att öppen länkad data är bra och något som ska jobbas med i framtiden. Nu kommer Riksarkivet, Kungliga biblioteket och Riksantikvarieämbetet att gå vidare i arbetet med att publicera länkad öppen data till nytta för användare, informationsförvaltare och samhället i stort.

/Susanne

2 kommentarer:

  1. Låter mycket spännande! Extra kul att tre så stora myndigheter gör något på riktigt tillsammans. Kan man se det live någonstans eller är det bara en intern demo?

    SvaraRadera
    Svar
    1. Hej! Tyvärr finns det inget live än, vi hoppas på att det kommer snart. /Susanne

      Radera