torsdagen den 31:e januari 2013

Länkad öppen data-workshop på Riksarkivet

Förra veckan (21 - 25 januari) hölls en workshop på temat öppen länkad data på Riksarkivet i Marieberg. Det hela sparkades igång på måndagen med att riksarkivarie Björn Jordell hälsade alla välkomna. Öppen data-evangelisten Peter Krantz berättade för en fullsatt hörsal vad öppen länkad data är och varför det är bra (Peters presentation finns här).

Peter Krantz visar den femstjärniga modellen för öppen data.

Personal från Kungliga biblioteket, Riksarkivet och Riksantikvarieämbetet arbetade tillsammans under veckan med att öppna och länka samman dataset som är av stort intresse också för många aktörer utanför de tre myndigheterna. Det dataset som det fokuserades mest på var auktoritetsposter (uppgifter om personer och organsiationer) från Riksarkivets NAD och ARKIS.

Arbetet tog avstamp från de poster som fanns både hos KB, RAÄ och RA. Man fokuserade på personposter eftersom dessa ofta är lättare att matcha mot varandra än t ex platser. "Sven Hedin" på Riksarkivet kan enkelt matchas och identifieras som samma person som KBs "Sven Hedin".

Rent praktiskt innebar det bl a att några aukoritetsposter för kända personer länkades till så kallade URIer. En URI är en kodsträng som identifierar en unik resurs. Två stora URI-källor är VIAF och DBPedia. Om vi fortsätter med exemplet "Sven Hedin" så är NADs post om Sven numera länkad till DBPedias Sven Hedin-URI. Till DBPedia pekar redan ett stort antal länkar från andra öppna datakluster. Genom DBPedia är man säker på att det är samma "Sven Hedin" som andra som länkat till posten avser.

Under veckan så identifierade man också vilka olika typer av auktoriteter som Riksarkivet har, och man tilldelade dessa typer lämpliga kodspråk, s k ontologier. För auktoritetstypen personer använde man ontologin FOAF (Friend Of A Friend - beskriver personer, deras aktiviteter, och hur de förhåller sig till andra personer och objekt). Förutom FOAF användes SKOS för att beskriva ämnesord och hierarkier, Dublin Core för allmänna bibliografiska begrepp, samt DBPedias egen ontologi för att med dess generella klasser och begrepp beskriva ytterligare detaljer, såsom födelseår och platser.

Matchning av RAs auktoritetstyper med lämpliga ontologier.

Det sattes även upp SPARQL-endpoints till den länkade data från RA som skapats under veckan, samt till RAÄs redan publicerade öppna data. En SPARQL-endpoint låter andra få åtkomst till datat så att t ex samsökningar i många datalager går att göra utan att först behöva importera/aggregera allt till en och samma databas.

Veckan avslutades på fredagen inför en åter smockfull åhörarsal med att Martin Malmsten presenterade vad som hade åstadkommits. Riksarkivarien och riksbibliotekarien var på plats, riksantikvarien hade representation närvarande. Alla tre var eniga om att öppen länkad data är bra och något som ska jobbas med i framtiden. Nu kommer Riksarkivet, Kungliga biblioteket och Riksantikvarieämbetet att gå vidare i arbetet med att publicera länkad öppen data till nytta för användare, informationsförvaltare och samhället i stort.

/Susanne

måndagen den 21:e januari 2013

Mer användning = mer nytta

Försäljare i "spacettes"-dräkter poserar framför raket-allén till Tupperware Home Parties Inc i Orlando, sommaren 1960.
Fotograf: okänd, State Library & Archives of Florida (no known copyright restrictions) 
Creative Commons-systemet fyllde nyligen tio år – hurra! – och det blir alltmer spritt och använt i hela världen. För kulturarvssektorn har CC erbjudit nya möjligheter att enkelt sprida historiska material, och för användare och publik nya chanser till en mer intensiv och interaktiv användning av källorna.

CC-licensiering har stora fördelar för bl a skolan men ökar också chansen att material från arkiv, bibliotek och museer mer allmänt sett sätts i rörelse, upptäcks av fler och kommer till nytta i fler sammanhang. Den stora potentialen hålls dock tillbaka av att många institutioner väljer förhållandevis strikta licensieringar. Framför allt kan man undra om vi inte överanvänder NC (non commercial – ickekommersiell).

Creative Commons Tyskland har tillsammans med Wikimedia Tyskland och iRights.info undersökt effekterna av detta och sammanställt en rapport som svarar på centrala frågor som:
  • Vad är egentligen kommersiellt bruk?
  • Skyddar NC-märkning verkligen mot kommersiell användning?
  • Kan NC-märkt material användas i skolan? I pressen? I Wikipedia?
Nu finns rapporten, tack vare Open Knowledge Foundation Tyskland, även på engelska. Den heter Consequences, risks and side-effects of the license module ”non-commercial use only – NC” och jag tror att den kan vara av intresse också för många svenska institutioner som står inför att öppna sina digitala samlingar och vill göra dem maximalt användbara för så många som möjligt.
Johanna Berg, Digisam