onsdagen den 29:e februari 2012

Släpp kulturarvet fritt - det är vårt!

Effektiviserat samarbete på Wright's Biscuit factory i Newcastle 1947. Foto:Turners, Tyne & Wear Archives & Museums 

I fredags ordnade Wikimedia Sverige ett välbesökt seminarium om ABM-sektorn i den digitala åldern. Wikimedia är föreningen bakom världens största uppslagsverk, Wikipedia, och den är av flera skäl en viktig aktör på kulturarvsområdet.
Wikipedias artiklar kommer högt upp vid googlesökningar och blir är därmed en viktig faktakälla på nätet för väldigt många – även professionella - användare. Encyklopedien innehåller miljontals poster, finns på massor av språk och kan räkna en halv miljard sidvisningar/dag. Den institution som inte deltar där går alltså miste om massor av publik, webbtrafik, kunskapsspridning och användardialog – vilket t ex den amerikanska museichefen och bloggaren Nina Simon skrivit om här .
Flera kulturinstitutioner – t ex Nordiska museet, Regionarkiv Västra Götaland och tyska Bundesarchiv - har redan lämnat bilder till Wikipedias mediedatabas. Det gör materialet fritt tillgängligt för alla som vill skriva eller illustrera artiklar i uppslagsverket – men också för andra typer av användning, t ex skolarbeten och olika webbapplikationer.
Nästa steg bör vara att bidra med texter och information. I stället för att många institutioner var för sig bygger upp interna kunskapsförråd med delvis samma innehåll, kan sektorn spara tid genom att samla data, personhistoria, ordförklaringar och bakgrundstext i en gemensam öppen bank på Wikipedia. Och det blir lättare och lättare. Europeana har nyss skapat ett automatiserat stöd för den som vill skriva artiklar på dataposter i deras sökindex eller använda dem som illustrationer till redan befintlig text, och även Kultur-IT:s gränssnitt Digitaltmuseum utvecklas på liknande sätt för att stödja Wikipedia-länkning. Svenska Wikimedia kan ge visst stöd till institutioner som vill ladda upp större mängder material, och planerar nu som bäst för en serie editathons – redigeringsverkstäder – i samverkan med intresserade parter.
Initiativtagare till fredagens möte var Lennart Guldbrandsson, som arbetar med en vitbok om öppen data för GLAM-sektorn med beräknad utgivning (i tryck) före sommaren. Avsikten är att ta fram stöd och råd för en öppen hållning på institutionerna och på ett konkret plan visa vägen genom lagens labyrinter. Lennart presenterade sitt arbete och inbjöd alla närvarande, alla deras kolleger och samtliga andra intresserade att bidra till boken med text, frågor och synpunkter på projektets wiki-sida. Skulle du vilja dela med dig mer diskret och förtroligt – om t ex dåliga upplevelser, tvister på arbetsplatsen, konflikter med rättighetshavare etc – kan du i stället maila Lennart direkt på lennart@wikimedia.se. För att vi ska kunna hitta lösningar på problem och svårigheter måste vi ju få upp dem på bordet, om inte annat i anonymiserad form. Målet är en användbar vägledning, inte en drömbok, och du är välkommen med dina erfarenheter!
På plats under eftermiddagen diskuterades många frågor om bristande kunskap &/eller insikt om den digitala utvecklingen på vitala punkter i organisationerna. Förhållandet mellan visionärt policyarbete, bred förankring och operativ implementering togs upp och även användardialogen berördes. Hur kan vi skapa kännedom om de material som inte finns på webben, och därmed öka chansen att de blir efterfrågade (och kanske digitaliserade)? Ett gott exempel finns i That’s not Online som inte agiterar för varken tryckpublicering eller digitalisering utan bara vill skärpa uppmärksamheten på att stora mängder värdefull information inte finns digitalt, ”ett faktum som ofta glöms bort i internetyran”. That’s not Online tar tacksamt emot postningar från institutioner i hela världen, men kanske skulle det också behövas en dedicerad svensk eller nordisk motsvarighet?
Under dagen lyftes också Public Domain Day som årligen firas i USA den 1 januari då nya upphovsmän inträder i fritt tillstånd. Konstnärer och författare som varit döda i sjuttio år är då inte längre under upphovsrättsligt skydd utan deras verk kan spridas och användas helt utan restriktioner. Från i år (2012) gäller det t ex målaren Robert Delaunay och författare som Karin Boye, Hjalmar Söderberg och Virginia Woolf. Det vore fint om svenska institutioner kunde fånga upp PD Day och i bred samverkan göra mesta möjliga för att skapa uppmärksamhet kring den kulturella allmänningen – och det som inte släpps ut där.

Johanna Berg, Digisam

fredagen den 24:e februari 2012

Linked Open Data

I ett tidigare blogginlägg berättade vi om att vi har börjat arbeta med frågor om den semantiska webben och Linked Open Data. Redan under vårt första arbetsmöte stod det klart att det finns mycket kring dessa begrepp som behöver tydliggöras. Det finns få exempel men desto fler frågor. Vad är det som egentligen behövs för att kulturarvsinformationen ska kunna bli en del av länkad öppen data?

Under de senaste åren har digitaliseringsarbetet såväl i Sverige som internationellt handlat mycket om att uppnå en kritisk massa information på Internet bl a för att kunna bygga innehållsrika portaler och tematiska applikationer som drar till sig användarnas intresse.
Idag - när det digitala kulturarvet ökar alltmer - framgår det tydligt att kulturarvsinformationen måste bli presenterad på ett sätt som optimerar potentialen i informationen. Detta innebär bl a att sökning efter kulturarvsinformation på nätet måste övergå från att användarna bara får slumpmässiga sökresultat till att förse dem med sökresultat som är anpassade och strukturerade utifrån individuella sökbehov och sökmönster Det är också viktigt att effekten av den ökande mängden kulturarvsinformation inte ger en mättnadseffekt så att man slutar leta om det man söker inte finns bland de första sökträffarna.  Det fordras alltså fungerande system för att länka information, bygga applikationer och göra sökningar i kulturarvsinformationen så relevanta och användbara som möjligt, och det är just det man försöker uppnå med länkad öppen data. Idag är de praktiska exempel få men visionerna många om vad som skulle uppnås.

Det verkar också råda oenighet kring begreppet länkad öppen data och vad det egentligen innebär i fråga om öppenhet. Det är, som oftast, viktigt att förtydliga begreppen. Vad menas egentligen med att tillgängliggöra kulturarvsinformation på Internet som en del av Linked Open Data? Att använda Internet för att distribuera data är t.ex. inte detsamma som att data blir tillgänglig för alla webbanvändare (även e-post kommunikation sker via nätet).
På samma sätt blir data som tillgängliggörs på Internet inte ”öppen” automatiskt bara för att den finns där, lika lite som det blir möjligt att länka den till annat material. För att vara ”öppen” måste informationen kunna lyftas från sitt ursprungliga sammanhang för att utan hinder användas och återanvändas i andra kontexter. Open data handbok som getts ut av Open Knowledge Foundation beskriver de legala, sociala, och tekniska aspekter av länkad öppen data och ger följande definition: ”Open data is data that can be freely used, reused and redistributed by anyone - subject only, at most, to the requirement to attribute and sharealike”.

Sedan förra året har jag varit engagerad i ett EU-projekt som heter Linked Heritage - Coordination of Standards and Technologies for the enrichment of Europeana. Linked Heritage har som huvuduppdrag att tillföra kulturarvsportalen Europeana nytt material från både offentlig och privat sektor, att höja kvaliteten på den metadata som finns i Europeana och att förbättra sökning, åtkomst och användning av innehållet i Europeana. Arbetet i Linked Heritage grundar sig i stor utsträckning på resultaten från ett tidigare EU-projekt kallat Athena.

Linked Heritage har nyligen gett ut publikationen " Your terminology as a part of the semantic web recommendations for design and management", (som kan laddas ner från projektets webbplats). Den vänder sig i första hand till dem som arbetar vid europeiska kulturarvsinstitutioner (framförallt museer) med rekommendationer kring terminologier och flerspråkighet (dvs hur man kan hantera bl a flerspråkigt kulturarvsdata för att göra det möjligt att samma begrepp kan länkas till varandra).

Vikten av att använda sig av vedertagna standarder, metoder och format för det digitaliserade materialet framgår allt tydligare ju mer man fördjupar sig i frågan om förbättrad sökning och åtkomst. Man måste se den övergripande bilden; även om ett visst kulturarvsmaterial är säreget och en egen lösning för standarder eller format vid en första anblick verkar vara att föredra, så är det sällan att föredra i längden. Användning av vedertagna standarder gör det lättare att utveckla kopplingar till datamodeller och att ta del av befintligt arbete med enhetligt standardiserat material som är i ständig utveckling. Allt detta främjar i längden största möjliga tillgång till och användningen av kulturarvsmaterial.

Sättet som kulturarvsinstitutionerna digitaliserar och hanterar sina digitala kulturarvsdata är den viktigaste förutsättningen för att informationen från kulturarvsinstitutioner ska kunna anpassas till att vara en del av Linked Open Data både i Europeana och i den semantiska webben. Med kulturarvslyftet och andra satsningar på digitalisering runt hörnet hastar det att starta en mer omfattande diskussion i frågan.

”Om vi på allvar bestämde oss för att bli avsevärt mycket bättre på att publicera öppen data skulle det innebära fler och bättre tjänster”, sade Anna-Karin Hatt, It- och energiminister, i sitt tal häromdagen på Regional Digital Agenda Skåne och det gäller även tjänster för kulturarvsdata.

/Sanja Halling, Digisam

måndagen den 20:e februari 2012

Heja Norge! Bruk er bra!

Syttende mai firas i Stongfjorden ca 1910. Foto: Paul Stang (Fylkesarkivet i Sogn og Fjordane)

Förra veckan lanserades en fin norsk rapport om webbpublicering av fotografi. Den heter ”Fotojuss - förarkiv, bibliotek og museum och har producerats i samarbete mellan de centrala norska kulturarvsmyndigheterna - Nasjonalbiblioteket, Riksarkivet och Kulturrådet. Både publik efterfrågan, allt starkare politiska signaler och interna ambitioner har bidragit till ökat intresse för materialen och skärpt uppmärksamhet på lagens tillämpning. Från en svensk utsiktspunkt blir man nästan avundsjuk när man ser hur tre centrala aktörer på det viset förmått samla sig till ett gemensamt ställningstagande baserat på kulturinstitutionernas samhällsuppdrag.

Norska ABM-institutioner beräknas förvalta omkring 40 miljoner fotografier och användningen har, precis som här hemma, hämmats av den stora osäkerheten om vad man egentligen får göra med dem. Bokens fokus ligger dock inte på förbuden, utan författarna koncentrerar sig på vad som är möjligt, tillåtet och önskvärt.

Huvudbudskapet till den norska kulturarvssektorn är att den bör börja arbetet med de enkla och okomplicerade materialen; foton med utslocknad upphovsrätt och bilder som institutionerna har formella rättigheter till. Man bör vidare kunna acceptera en viss kalkylerad risk, och den som behöver mer specificerad rådgivning kan kontakta norska Nasjonalbibliotekets jurister som har i explicit uppdrag att stödja hela sektorn.

Boken inleds med en övergripande programförklaring och ett tiopunktsprogram (sidan 13) som är precis lika tillämpligt i Sverige. I de följande kapitlen förs utförliga resonemang om upphovsrätt (åndsverksloven) och personskydd (personvern). Det är läsvärt för den specialintresserade men kanhända förvirrande för många svenskar, eftersom lagen på viktiga punkter skiljer sig från svenska förhållanden.

Mest inspirerande är, tycker jag, praxisavsnittet som med autentiska exempel diskuterar de svåra frågor många bildarkivarier står inför i sitt dagliga arbete. Det är inget facit, men ger ändå stöd för bedömningar i linje med lagen.

En evig fråga rör t ex skillnaden mellan fotografisk bild och fotografiskt verk, och Nasjonalbibliotekets jurister slår mycket tydligt fast att den måste avgöras på juridiska och inte fotografiska grunder. Själva existensen av en dubbel reglering tolkar de som att ett verk måste vara något alldeles enastående. Det saknar därför helt betydelse om upphovsmannen är professionell, berömd eller lagt ned tid och pengar på att åstadkomma bilden. Viktigt är att minnas är däremot kravet på individualitet – den unika, personliga, tolkande blickens prägel. Kan man anta att fotot blivit likadant med en annan fotograf är det sannolikt inte fråga om ett verk.

Vidare diskuteras bl a vad som gäller för negativ i relation till kanske kraftigt bearbetade positiv/kopior (alltid samma skyddsklassning), och vad som menas med att en bild offentliggjorts. Etiska frågor tas också upp, med tankeväckande exempel på t ex medicinska dokumentationsbilder och gruppfoton av barn i olika sammanhang. Det är viktigt är att även etiska avgöranden baseras på professionella riktlinjer, det kan ju inte vara det personliga tyckandet som avgör om t ex ett ansikte ska pixlas. Den potentiella skadan av en integritetskänslig publicering är dessutom större än vid en upphovsrättskränkning, eftersom den inte kan göras ogjord och kanske inte heller kompenseras med pengar.

Med Fotojuss har den norska kulturarvssektorn tagit viktiga första steg. Per Olav Torgnesskar, som varit huvudredaktör för boken, understryker att den ska ses som början på en längre process. Den besvarar en del - men långt ifrån alla - frågor. Lagtillämpningen är fortfarande ett svårt område, säger Torgnesskar, och det vi nu måste gå vidare med är i första hand licensieringsfrågorna.

Johanna Berg, Digisam

tisdagen den 14:e februari 2012

Bevarande som en förutsättning för användning av det digitala kulturarvet idag och i framtiden.

                                          Photo: Edmund Tse, CC BY 2.0

Det fanns en genomgående samstämmighet i frågan om samordnade lösningar för långsiktigt digitalt bevarande i de svar som inkom från institutioner och myndigheter på regeringens uppdrag om ett underlag för en nationell strategi för digitalisering, elektronisk tillgång och digitalt bevarande.

Vi har nu i Digisam börjat utreda vad det är som behövs för de samordnade lösningarna. För ett par veckor sedan samlade vi de som arbetar på Riksarkivet med de här frågorna för att närma oss problemet. Vi tittade bl a på hur man arbetar med dessa frågor idag. På Riksarkivet har man gjort det under lång tid då man redan under 1970-talet började få in digitala leveranser av arkivmaterial från statliga myndigheter.

Den första frågan att ta itu med är vad digitalt bevarande egentligen är. Oftast pratar vi i ABMK-området om digitalt långtidsbevarande. Men bakom den termen döljer sig flera olika begrepp och vägval som förutom långsiktiga lösningar även kan handla om bevarande på kort och medellång sikt. Det finns flera olika definitioner på långsiktig digitalt bevarande, ofta beroende på sammanhanget. På LDB-centrums (Centrum för långsiktigt digitalt bevarande) webbplats finns följande definition som jag tycker sammanfattar problematiken på ett bra sätt: ”Långsiktigt bevarande: En tidsperiod längre än livstiden för systemet (hårdvara och mjukvara). Att bevara med sikte på ”nästkommande generationer.” I dag beräknas medellivslängden för digitala system vara mellan tre och sju år.”

LDB-centrums definition pekar på det centrala i frågan, att det gäller att förvalta informationen strategiskt så att bevarande av digital information sker med samma målbild som för den analoga informationen. I svensk arkivkontext finns det ingen bortre tidsgräns för de allmänna handlingar som den offentliga förvaltningen ska bevara, då offentlighetsprincipen inte är tidsbegränsad.

En stor del av problemet är att teknikutvecklingen gör att mjuk- och hårdvara inte har någon längre hållbarhet än några år.  Det innebär att man ständigt måste migrera den digitala informationen för att säkra att den kan bevaras för framtiden. För att kunna hantera den i framtiden behöver man också tekniska metadata av olika slag och för att förstå den dessutom inte bara kunskap om innehållet, utan också om t ex struktur och kontext. I arkivsektorn arbetar man ofta med konceptuella modeller som OAIS-modellen där ”arkivpaket” med metadata beskriver både hur informationen ska läsas och den tekniska miljön som den skapades i.

Under senare år har flera EU-projekt haft stor betydelse för arbete med digitalt bevarande, bland annat CASPAR, PLANETS, m m. Riksarkivet har också deltagit i arbetet kring digitalt bevarande i olika europeiska sammanhang bl a som koordinator för PROTAGE, ett forskningsprojekt som handlade om tillämpning av agentteknologi i digitalt bevarande.

I de samtal vi haft hittills med företrädare för institutioner inom kulturarvssektorn har flera uttryckt önskemål om att utreda om en centralt förvaltad molnlösning skulle kunna vara ett alternativ. Det är med stor sannolikhet mer kostnads- och resurseffektivt än att alla institutioner ska lägga resurser på kompetens, personal och att bygga upp egna tekniska lösningar. Men för att en gemensam lösning ska vara möjlig är det oerhört viktigt att definiera vilka behov av bevarande som olika institutioner har för olika typer av material. Annars går det inte att välja rätt bevarandelösning. Allt material digitaliseras inte för att bevaras ”för alltid” men bevarandeaspekten är central innan en digitaliseringsprocess sätts igång. Vi har bara börjat med att försöka greppa den komplexa bevarandefrågan och återkommer i ämnet i takt med att vårt arbete fortskrider.

Arbetar du med digitalt bevarande inom kulturarvssektorn? Skicka oss gärna dina synpunkter!

/Sanja Halling, Digisam