.
Kan katalogisatorer i danske biblioteker bruge WorldCat?

Bibliotek.dk i WorldCat
WorldCat, der drives af den USA-baserede organisation OCLC (Online Computer Library Center), er verdens største bibliografiske database med mere end 90 millioner poster. De refererer til over 1,4 milliarder dokumenter i mere end 71.000 biblioteker over hele verden.

I begyndelsen af 2008 tog DBC, der i adskillige år har været dansk agent for OCLC, sammen med Styrelsen for Bibliotek og Medier samt Statsbiblioteket initiativ til et projekt, der havde som overordnet mål at gøre den danske kulturarv mere synlig i WorldCat. I praksis skulle dette ske ved at eksportere hele bibliotek.dk til WorldCat.

WorldCat som kilde til genbrugskatalogisering
Projektet, der blev afviklet i DEFF-regi, havde forskellige afledte delprojekter, hvoraf ét var at analysere og vurdere, om det ville være en fordel for danske folke- og forskningsbiblioteker at få adgang til at genbruge posterne i WorldCat i deres eget katalogiseringsarbejde.

I sommeren 2008 blev der med Statsbiblioteket som projektansvarlig gennemført et forsøg, der skulle hjælpe til med at besvare to spørgsmål:

  • Er det muligt fra WorldCat at downloade katalogposter for udenlandsk materiale, hvor søgning i DanBib (inkl.  ”nationalbibliografiske” baser som Library of Congress (LC), British National Bibliography (BNB) og Deutsche Nationalbibliographie) giver negativt resultat?
  • Har posterne fra WorldCat en kvalitet, der kan måle sig med den, der kendes fra DanBib-posterne?

I forsøget deltog fire forskningsbiblioteker: Det Kongelige Bibliotek, Statsbiblioteket, Danmarks Pædagogiske Bibliotek og Syddansk Universitetsbibliotek. Og fem folkebiblioteker: Gentofte, Roskilde, Vejle og Aalborg Bibliotekerne samt Odense Centralbibliotek.

Flere hit i WorldCat
Forsøgsmaterialet blev udgjort af 1429 udenlandske bøger, noder og cd’er fra den løbende accession. Til de 1429 skal der lægges et ukendt antal enheder behandlet på Det Kongelige Bibliotek.

Alt materiale blev slået op både i DanBib og WorldCat. Det gav følgende antal hit opstillet i skemaform:

1 – Kun angivet som ”omkring 95%” af de søgte 200 titler.
For alle biblioteker under ét ser tallene således ud:

Bruger man WorldCat i stedet for DanBib er det altså muligt at forøge hitprocenten med næsten 16 points.

Det er åbenbart, at helt nye publikationer hurtigere finder vej til WorldCat end til DanBib. Derudover er det især på følgende områder, at WorldCat har mere at tilbyde:

  • engelsksprogede publikationer fra lande, hvor engelsk ikke er nationalsprog (herunder publikationer fra internationale organisationer)
  • publikationer på andre fremmede sprog end engelsk (fx romanske sprog)
  • musikoptagelser og andet AV-materiale

Hvordan ser posterne fra WorldCat ud?
Posterne i WorldCat kommer fra flere forskellige kilder, og det er ikke ualmindeligt at finde 5-6 forskellige poster for den samme bog. Blandt dem vil der meget ofte være én, der stammer fra LC, eller i det mindste ser ud, som om den gør det (LC en af de store dataleverandører til Worldcat). Disse poster kan siges at være på nationalbibliografisk niveau, og de fleste forskningsbiblioteker vil kunne genbruge dem med et minimum af tilretning.

Nu og da møder man dog meget enkle poster, som man uvilkårligt vil mistænke for at være ”undervejsposter” eller accessionsposter. De mangler som regel felt 300 og 260*a, og brugen af store og små bogstaver i titeloplysningerne
følger ikke de gængse regler. Der er hverken ophavsangivelser i felt 245 eller funktionskoder i felterne 1xx og 7xx.
Over halvdelen af WorldCat-posterne indeholder emneord, indholdsnoter og links til diverse supplerende oplysninger om de beskrevne publikationer. Af de 225 WorldCat-poster, som Roskilde Universitetsbibliotek fandt, havde 160 Dewey-klassifikation, 81 indholdsbeskrivende noter og 180 emneord (Library of Congress subject headings o.a.).

Hvad mener bibliotekerne?
De fleste testbiblioteker nøjedes ikke med at indrapportere resultater i form af tal for undersøgte materialer, fund i den ene og anden katalog osv., men benyttede også lejligheden til i mere ubundne kommentarer at beskrive, hvordan de vurderede WorldCat som katalogiseringskilde. Her er et udpluk af disse kommentarer:

Posterne fra WorldCat er generelt af en meget fin kvalitet, og vi kan se at mange også indeholder link til indholdsfortegnelse m.m. – Vi har i øvrigt specielt hæftet os ved, at vi har været i stand til at finde en meget stor del af de fransksprogede bøger i WorldCat. Dette er meget positivt, da de ikke i samme omfang kan genbruges fra DanBib. (Syddansk Universitetsbibliotek).

Størstedelen af vores indkøb er materialer på engelsk og her er meget lidt at hente i Worldcat i forhold til DanBib. – Det var en positiv overraskelse at anvende WorldCat i forbindelse med katalogiseringen af russiske bøger. Ud af syv bøger var de seks repræsenterede i WC og indholdet i katalogiseringerne var righoldigt og umiddelbart til at anvende, også i de tilfælde, hvor der var tale om andre udgaver. – Vi skal bruge dk5, danske emneord og noter og skal under alle omstændigheder gennemarbejde katalogiseringerne. – Jeg er overrasket over ”hitprocenten” ved søgning på musik i WorldCat. Det er positivt. – Det bliver straks mere problematisk, når posten skal genbruges til katalogisering. Det skyldes især, at vi i musikken benytter felt 795 som indholdsnote (genereres ved felt 531). De
enkelte musiktitler angives herefter i hvert deres delfelt. Denne praksis er af største betydning for søgemulighederne på de enkelte værker. Derfor er forekomsten af felt 530 kun brugbart til verificering og kopiering til felt 795. Samme pointe gør sig gældende i.f.m. emnefelterne.
(Vejle Bibliotekerne).

Meget materiale ligger i DanBib, men endnu mere i WorldCat. – Vi kan godt og vil gerne anvende WorldCat-poster. – Der skal rettes meget til, da mange koder og feltnumre er anderledes. – Jeg har sjældent kunne genbruge emneordene, men har i enkelte tilfælde oversat dem til dansk. (Odense Centralbibliotek).

Overordnet er vores konklusion på afprøvningen, at det ikke er en fordel eller tidsbesparende for os på et folkebibliotek at downloade poster fra WorldCat – tværtimod. Der er alt for meget, der skal kontrolleres, tilrettes, oversættes, overflyttes til andre felter mv. Dermed øges også mulighederne for fejl. – Vi må konstatere, at det er langt nemmere for os at gøre arbejdet selv fra starten med udgangspunkt i materialet og at anvende WorldCat-posten som supplement og inspiration på linje med oplysningerne fra Amazon og andre relevante steder på nettet, som er vores normale katalogiseringspraksis. (Aalborg Bibliotekerne).

Problemer
WorldCat modtager som nævnt poster fra mange forskellige kilder. Der ser ud til at ske en vis matchning af posterne, men efter hvilke kriterier står ikke klart. Der er heller ikke i posterne nogen entydig angivelse af, hvor de kommer fra. Når man som svar på sin søgning får et helt sæt af poster, må man derfor se posterne igennem én for én og vurdere, hvilken der svarer bedst til ens behov.

Flere af folkebibliotekerne nævner, at det er en hindring for genbrug af musikposter, at danMARC2’s brug af analysefelter (770, 780,795) kombineret med en indledende tekst til en maskingenereret indholdsanalyse i felt 531 er fremmed for MARC21. Desværre er det et problem, man ikke kan konvertere sig ud af! Det samme gælder sådan set danMARC2’s metode til katalogisering af flerbindsværker i hoved- og bindposter, men det har ingen omtalt i testrapporterne.

Hvad sker der efter forsøget?
De analyser og forsøg, der blev gennemført i løbet af 2008, pegede på klare fordele ved et udvidet samarbejde med OCLC om WorldCat. Der blev derfor den 19. december 2008 underskrevet en aftale, som dels giver danske biblioteker adgang til at bruge WorldCat som kilde til genbrugskatalogisering, dels indebærer, at den samlede bestand på danske offentlige biblioteker skal uploades til WorldCat.

For 2009 er der planlagt et opfølgningsprojekt, der skal implementere det aftalte samarbejde mellem danske biblioteker og WorldCat. På katalogiseringsområdet har Statsbiblioteket påtaget sig at dokumentere World-Cats datamodel og udforme et sæt guidelines for genbrug af data fra WorldCat, og de skal rette sig både mod folke- og forskningsbiblioteker. Desuden skal der foretages yderligere undersøgelser af bl.a. mulighederne for at berige ”data-fattige” poster fra WorldCat, for at konvertere emnedata og for at bruge WorldCat-links til fremskaffelse af supplerende data (forsider osv.).