tisdagen den 31:e januari 2012

En mer avancerad form av länkning


Visualiseringsdiagram av Anja Jentzsch 

Semantik - det låter bra och många pratar om det, men vad är det egentligen? För några veckor sedan ordnade vi på Digisam vårt första problemformuleringsmöte på temat. Många som jobbar i kulturarvssektorn har efterlyst verifierade auktoritetslistor till stöd för institutionernas arbete, men listorna gör inte mycket nytta utan sammanhang och det är därför vi behöver tänka semantiskt. Vi kände att vi behövde hjälp med att hitta de gemensamma utvecklingsområdena och formulera de mest trängande behoven på det område inom sektorn som vetter mot semantik och LOD (linked open data).
Efter en innehållsrik dag med smarta deltagare från KB (Göran Konstenius, Martin Malmsten, Miriam Säfström & Lisa Winberg), Riksarkivet (Martin Bjersby & Mårten Johansson) och RAÄ (Henrik Summanen) kan vi konstatera att det finns flera saker att ta tag i. Vi behöver:

  • Sprida kännedom om semantik och LOD i minnessektorn, i linje med Tim Berners-Lee’s guldstjärnor.
  • Arbeta för fler öppet tillgängliga auktoritetslistor för entiteter av gemensamt intresse, i synnerhet historiska personer.
  • Fundera över Wikipedias roll och funktion i ett utbyggt semantiskt informationssystem.
  • Sammanställa konkreta exempel på hur semantifiering och LOD fungerar i praktiken.
Hör gärna av dig om du har synpunkter på hur vi bäst kan jobba tillsammans för att maximera den gemensamma nyttan av den utveckling som redan pågår.

Johanna Berg, Digisam

måndagen den 30:e januari 2012

Digital infrastruktur

Photo: Arild Nybø, CC BY-NC-SA 2.0

Under de senaste två åren har jag arbetat med DC-net, ett EU-finansierat projekt, där Riksarkivet deltar som svensk partner. Projektet är sektorsövergripande och syftar till att främja den digitala infrastrukturen för att underlätta tillgången till forskningsinformation i digital form från kulturarvssektorn. Projektet går nu mot sitt slut och för oss på Digisam är nu målet att ta med oss resultaten av projektet i vårt uppdrag.

Begreppet ”digital infrastruktur” används ofta idag när man pratar om digitalisering, men vad menas med det egentligen? För det mesta används begreppet för att beskriva tekniska förutsättningar som bandbredd på Internet men det kan stå även för andra förutsättningar för att materialet ska kunna tillhandahållas på ett användbart sätt, som metadatastandarder, obrutna länkar, digitalt bevarande på kort och lång sikt, säkerhet m m. 

Det sker idag en snabb utveckling vid kulturarvsinstitutionerna i Sverige för att överföra kulturarvsmaterial till digital form och därmed göra materialet mer lättåtkomligt och användbar via Internet. En förutsättning för att detta sker på ett effektivt och ändamålsenligt sätt är att det finns en digital infrastruktur som är gemensam för hela kulturarvsområdet. Inom ramen för DC-net genomfördes en enkätsundersökning om digitala infrastrukturer bland kulturarvsinstitutionerna som visade att det fanns stora variationer i fråga om bandbredd, alltifrån 0,25Mb/s till 100 Mb/s. Ändå var det ca 80 – 90 % av de institutionerna som besvarade enkäten som tillgängliggör delar av deras bestånd/samlingar via Internet. Behovet av gemensamma lösningar lyfts också fram i Regeringens nya nationella digitaliseringsstrategi

Idag kan det vara svårt för framför allt mindre kulturarvsinstitutioner utan tillgång till en kraftfull infrastruktur att synas i det digitala rummet och att där göra sitt material lättillgängligt och användbart. Genom ökad samordning och en gemensam digital infrastruktur för kulturarvssektorn med ett brett utbud av tjänster kommer kulturarvsinstitutionernas digitala samlingar och bestånd att på ett bättre sätt bli tillgängliga för både forskningen och den breda allmänheten.

Sanja Halling, Digisam 
                                         

torsdagen den 26:e januari 2012

Digitalisera snabbare!


Analogt biblioteksarbete på den gamla goda tiden, New York Public Library
(No known copyright restrictions) 

Före jul hade jag glädjen att delta i Digitalisera snabbare! ett seminarium om effektiva arbetsflöden för digitalisering, i arrangemang av Anders Söderbäck på Stockholms universitetsbibliotek. Det var spännande att möta universitets- och forskningsbibliotekarier, en för mig ny krets i digitaliseringsarbetet, och på något sätt betryggande att deras frågor och problem var så lika dem jag brukar möta inom andra delar av kulturarvssektorn.

Bland talarna fanns Richard Davies, digital approvals manager på British Library, som berättade om de stora digitaliseringsprojekt som biblioteket driver i samarbete med Google. Han tecknade också bakgrunden i den omsvängning som institutionen gjort från vad Davies kallar exklusiv lyxdigitalisering till bredare, mer storskalig massdigitalisering.
Davies menade att den där exklusiva varianten nog kan vara motiverad när det gäller vissa unikt värdefulla, komplexa och ömtåliga material som t ex Beowulf eller Magna Charta. På svensk botten kan vi jämföra med objekt som Djävulsbibeln eller kanske det Augsburgska konstskåpet.
Men i allmänhet, menar Davies, blir det för dyrt att arbeta på det sättet. Framför allt kostar det för mycket att göra själva urvalet, då kvalificerad personal måste lägga mycket tid på att hämta fram, sortera, bedöma och prioritera objekten innan de kan skickas in i själva digitaliserings­processen. Det betyder höga marginalkostnader och onödigt slitage på både utvalt och nedprioriterat material, och en alltför långsam process för en institution som i sina samlingar har ungefär 14 miljoner böcker.
Därför jobbar British Library nu med digitalisering av större sammanhållna materialkategorier, som t ex brittisk dagspress. I den modellen prioriteras hela samlingar för digitalisering och eventuellt extraarbete kan under processens gång läggas på de objekt som av någon anledning behöver särskild omsorg i form av rengöring, konservering eller informationskomplettering. Mindre resurser ger på det viset mer resultat ut till användarna. Kvantitet vinner alltså över (extremt hög) kvalitet, och det tror jag är bra. Vad tycker du?

Johanna Berg, Digisam