.
Formater og søgeveje

– Hvilke konsekvenser har det valgte format for søgevejene? Hvad er praksisregler, og hvorfor er de nyttige
ved Bodil Dalgaard-Møller, Dansk BiblioteksCenterBodil Dalgaard-Møller, som nu er ansat i Dansk BiblioteksCenter, har en mangeårig erfaring med katalogisering fra DVJB. I dag indgår Bodil Dalgaard-Møller i “DanBib-teamet”, hvor hun arbejder med konvertering af data fra MARC21, oplægning af registre i bl.a. DanBib, opsætning af Z39.50-klienter og opsætning af targets for formater og registre.

Hvad betyder formatvalget for mulige søgeveje?

Søgbarhed er en relativ størrelse, der bl. a. afhænger af: systemets formåen og fleksibilitet, fx hvordan systemet håndterer ISBD-tegn, hvor detaljeret kan det plukke søgekriterier og hvordan håndteres koder.
Standarder og samarbejder – kravene til, hvad katalogen skal præstere, varierer i forhold til det enkelte biblioteks funktion og samarbejdsparter både fagligt og systemmæssigt
Centrale løsninger – mulighed for egen trimning eller systemleverandørens trimning, importerede posters kvalitet og katalogposternes homogenitet.
Databaseopbygning og formater – basens muligheder/begrænsninger, postkvalitet, ensartethed, formatspecificitet og dets tabeller.
Grænsefladens funktionalitet og opsætning – grafisk og/eller tegnbaseret, drop down-mulighed, klik-mulighed, foruddefinerede søgninger.
Ressourcetildeling til katalogen – fx antal arbejdstimer til trimning.
Formatet er altså kun én af mange influerende parametre.

Søgbarhed i Danmark

Fællesbasen DanBib skal kunne honorere alle forskellige behov. Derfor har den i princippet det mest muligt udbyggede søgesystem. En bred vifte af søgekoder (lige nu 133) både brede og specifikke. Efter ønske fra de professionelle brugere understøtter den stadig CCL-søgning, men har nu også grafik, som er taget med over i Netpunkt. Erfaringerne hermed har vist, hvor vigtige koder og datakonsistens er for drop down.
DanBib har et stort registerapparat og skal give mulighed for fleksibel søgning, da der søges meget forskelligt i de17 mio. poster.

De lokale kataloger tjener snævrere formål, hvorfor de kan målrettes mod primærbrugerne. Dataudvælgelsen er individuel – ressourcetildelingen bestemmer her. Men dataopdelingen er vigtig, og det er vigtigt med sondringsdata.
Udvælgelsen af søgekoder er selektiv – inden for givne rammer har man mulighed for at vælge forskelligt med samme datagrundlag, under forudsætning af at datagrundlaget er i stand til at dække forskellige tilgængelighedsbehov både søgemæssigt og visningsmæssigt. Grænsefladerne kan være både tegnbaserede og grafiske, hvilket vil blive kompliceret, hvis man skifter til MARC21, fordi formatet ikke er nær så specificeret.

DanMARC2-komplekset

Katalogiseringsregler og bibliografisk standard for danske biblioteker
danMARC2
Praksisregler for søgeveje
Bath-profilen
DanZIG-profilen
Rammeformater: ISO2709. linieformatet og XML

I Danmark har vi et unikt fælles fundament for postopbygning og søgetraditioner.
Såvel formatet som katalogiseringsreglerne er fælles for folke- og forskningsbiblioteker og tilpasset danske forhold og traditioner. Formatet er entydigt og forholdsvis nemt at validere. Dette har betydning for genbrug af poster. Praksisreglerne er BC’s de facto standard for registre og deres indhold.
Hertil knytter sig danZIG-profilen, som hviler på Bath-profilen, der er et internationalt forsøg på “maskine til maskine”-forståelse vha. Z3950. Bath-profilen henvender sig til både MARC og DC. DanZIG-profilen er den danske pendent. Men inkorporerer danske registre, som de er defineret i praksisreglerne.
Rammeformaterne er redskaber til indpakning af poster. ISO2709 såvel som linieformatet retter sig mod danMARC, mens XML primært retter sig mod DC, men også fx Bookdata og nettjenester.
Tilsammen udgør komplekset en éntydig dokumenteret verden med fælles spilleregler.

MARC21-komplekset

AACR2
MARC21
Lokalt definerede søgekoder?
Bath-profilen, regionale profiler, lokale tilpasninger
Rammeformater: ISO2709, XML

Hvis vi kigger på MARC21-komplekset, er det en mere diffus verden med mange bidragydere. Formatet relaterer til den engelske udgave af de angloamerikanske katalogiseringsregler. Det er et format i forandring pga. mange nye “updates” at tage hensyn til i registre mv. Der findes vist ikke et sæt praksisregler for søgeveje til MARC21, – i al fald er der stor forskel på anvendelsen af søgekoder i OCLC og LC. Der findes heller ikke nogen “danZIG”, men en vifte af forskellige profiler og mængder af lokale variationer af formatet. Hvorfor flere samspilbeslutninger skal træffes og evt. defineres.

Dublin Core og andre ikke-MARC-formater

Som vi netop har hørt, er der også andre formater på banen. Men først må der træffes bagvedliggende beslutninger om semantik og dataudvælgelse. Der er standarder under vejs, men hverken regler eller format er givet på forhånd. Der skal træffes aftaler om udformning af tags mv., de facto standarder er under udvikling, fx er DC nu overordnet vedtaget, men udfoldningen er meget forskellig. Også søgemuligheder må defineres. Søgning/klik via grafiske flader eller relationsdatabaser. Findes der vejledninger i baseoplægning? Indholdet skal dokumenteres: “Hvad får man når …?” Rammeformatet er ofte XML, men også andre er på banen. Det er en meget åben verden, da det ofte bruges ved netdokumenter. Alt i alt er det meget speget og overladt ti frit initiativ. Alt skal dokumenteres ved samspil/udveksling/samsøgning.
Lad os derfor vende tilbage til vores “trygge verden”!

Hvad er praksisreglerne?

Efterhånden er der et vist kendskab til denne “vejledning”. Men hvorfor er den så vigtig?
Praksisreglerne definerer søgekodenavne og -indhold i form af felter. Der er et fælles søgekodesæt og standard for hvilke felter, man får via de enkelte koder. Men der er også plads til lokale koder med andre navne.
Praksisreglerne definerer søgestrenge til både ord- og sætningsregisteropbygning (godt ved samsøgning). Især er sætningsregisterdefinitionerne nyttige – nogen har tænkt logik for os, og man kan slå op og se, hvad man præcist søger i.
Praksisreglerne definerer udfoldning af div. koder. Nyttiggørelse især fra1-bogstavkoder til 2-bogstavkoder (mere mnemotekniske) til klartekst.
Praksisreglerne bygger på de danske katalogiseringsregler med udgangspunkt i bd 1, de udnytter danMARC2 til mindste delfelt og forholder sig til alle officielle felter og delfelter – “med eller ikke med”.
Praksisreglerne udgør fundamentet for danZIG-profilen – udgør en perfekt definition på attributindhold i danZIG.
Praksisreglerne findes på Biblioteksstyrelsens hjemmeside (www.bs.dk).

Hvordan forholder dette fundament sig så til MARC21 (og DC)-verdenen?
Vi må finde noget at sammenligne med og på – og det er svært, da søgeopsætningen jo er relativ, som tidligere nævnt.

Bodil Dalgaard-Møller viste herefter en række eksempler dels på sammenfald eller snarere manglende sammenfald mellem BIB1-koder henholdsvis i forhold til danZIG og OCLC (30 sammenfaldende typer og 33 ikke-sammenfaldende i OCLC, 28 sammenfald i danZIG) – og hvad så med DAN1-koder, som vistes i en oversigt, samt spørgsmålet om deres status i forhold til MARC21? Endvidere belyste Bodil Dalgaard-Møller forskellene mellem formaterne eksemplificeret vha. formatering af nogle få posttyper. Der henvises for disse eksempler dels til Fabitas hjemmeside dels til DF’s hjemmeside, hvor alle slides vil blive lagt op).

Bodil Dalgaard-Møller rundede af med at påpege: at det har betydning, at der er mange komponenter i søgeveje. At formatspecificitet og datakonsistens influerer direkte på fleksibiliteten. At et fælles håndteringsgrundlag er en stor fordel ved genbrug og samsøgning, og at formatvalget bør bestemmes af de data, der skal lagres/søges/udveksles og de sammenhænge, disse data skal indgå i.

Ref. Hanne Grau