.
Hvordan ser XML-formater ud i forhold til danMARC2? Hvordan er det så med Dublin Core i denne sammenhæng? Herunder forskel på ramme- og indholdsformat

ved Paul B. Jensen, Dansk BiblioteksCenterPaul B. Jensen arbejder i “DanBib-gruppen” med konvertering af diverse MARC-formater til danMARC2 samt modsat til MARC21, følger formatdiskussionen mellem MARC-formater og diskussionen, om man hellere skulle have MARC21 eller XML. DBC opfatter dem ikke som sammenlignelige, XML er et rammeformat.

Indholdsformater kontra rammeformater

Paul B. Jensen opridsede følgende:

formater.jpg

Indholdsformaterne strukturerer de bibliografiske poster i hht. gældende standarder og skal indeholde de grundlæggende indholdsmæssige elementer, såsom forfatter/author/creator/contributor (100/700) osv. Rammeformaterne “lagrer” de bibliografiske poster. Paul Jensen gennemgik rammeformaterne belyst ved eksempler, se eksemplerne på: http://grupper.bf.dk/fabita/

I Linieformatet, som vi kender fra DanBib, begynder hvert felt på en ny linie. Linierne har en maksimal længde – og hvis der er behov for flere tegn, starter den nye linie med fire blanktegn.

ISO2709 er en kompakt lagring af MARC-formatet dels til lagring dels til udveksling.

I XML (eXtensible Marcup Language) sættes hver tag i < … > og gentages til afslutning, men med en skråstreg foran feltkoden, systemet er udviklet af World Wide Web-konsortiet (W3C), eller man skriver . Herunder følger diverse delfelter efter samme melodunde (se eksemplerne). Denne metode er udviklet af Library of Congress.
XML er en åben standard. For at kunne konvertere fra et XML-format til et andet format må man derfor bruge nogle standardværktøjer. Den konkrete tagnavngivning defineres derfor i et XML-schema eller DTD (Data Type Definition).

Paul B. Jensen gik herefter over til indholdsformaterne. For MARC21 henviste Paul Jensen til: www.loc.gov/marc/

DCMS (Dublin Core Metadata Set) er oprindelig tænkt som et sæt af metadata beregnet til indlejring i netdokumenter. Man begynder og slutter med tags i overensstemmelse med XML.
Der findes to former: “Simple DC”, som indeholder 15 grundlæggende elementer: titel, forfatter, udgiver, sprog mv, og “DC Qualified”, der supplerer med underelementer, “refinements”.

ONIX (Online Information eXchange) er udviklet til at distribuere informationer om udgivelser fra forlag til boghandlere mv.
MODS (Metadata Object description Schema) er udviklet af Library og Congress
Og MARC Standards Office. Der er flere elementer end i Dublin Core, og det er mere biblioteksorienteret end ONIX. Samtidig er det enklere end det fulde MARC-format.

I XML kan man bruge tags, som er mere eller mindre selvforklarende, men de anvendes dog efter nærmere bestemte regler. Man er nødt til at formatere indholdet. Paul B. Jensen henviste i øvrigt til DBCs hjemmeside, hvor Susanne Thoborg har lagt en artikel om MARC og det der ligner – se: www.dbc.dk/danbib/rammeformat.htm

Ref. Hanne Grau