-
Notifications
You must be signed in to change notification settings - Fork 63
Kopieren von Strukturelmenten und deren Metadaten in einer meta.xml Datei
Es ist in Kitodo.Production möglich, Meta- und Strukturdaten direkt in der XML-Datei zu bearbeiten. Ein Anwendungsfall ist das Kopieren der Struktur-und Metadaten von Vorgängen gleichen oder ähnlichen Inhalts. Wenn Digitalisate eine ähnliche und umfangreiche Struktur aufweisen, ist es sehr zeitintensiv, die Strukturen anzulegen und diese mit Metadaten auszuzeichnen. Eine Möglichkeit, das manuelle Anlegen zu umgehen, ist das Kopieren der Inhalte direkt in der meta.xml-Datei.
Diese Manipulation muss äußerst sorgfältig durchgeführt werden, da die Datei bei fehlerhaftem Kopieren invalide und somit unbrauchbar wird. Um Fehler zu vermeiden, wird zunächst die Struktur der Datei erläutert, danach werden die Bereiche benannt, die kopiert werden.
Die Datei entspricht dem METS-Standard, jedoch handelt sich um ein Kitodo-internes Format und nicht um die Datei, die nach dem Export erstellt und archiviert wird.
Bevor die meta.xml-Datei manipuliert wird, muss deren Struktur klar worden sein. Sie besteht aus folgenden Teilen:
- Deskriptive Metadaten
- Titel-Metadaten
- Metadaten der Strukturelemente
- Path Image Files
- Links zu den tif-Dateien
- Strukturelemente
- Paginierung
- Links
Weitere Informationen zur <dmdSec>
finden sich unter: http://www.loc.gov/standards/mets/METSOverview.v2.html#filegrp
In diesem Bereich werden die deskriptiven Titelmetadaten der Vorlage (Monografie, Zeitschriften-Band, ...) gespeichert. Das Element ist als DMDLOG_0001
bezeichnet.
Beispiel:
<mets:dmdSec ID="DMDLOG_0001">
<mets:mdWrap MDTYPE="MODS">
<mets:xmlData>
<mods:mods >
<mods:extension>
<goobi:goobi">
<goobi:metadata name="CatalogIDDigital">20052145Z</goobi:metadata>
<goobi:metadata anchorId="true" name="CatalogIDDigital">349689334</goobi:metadata>
<goobi:metadata name="CurrentNo">43.1900</goobi:metadata>
<goobi:metadata name="CurrentNoSorting">1900</goobi:metadata>
<goobi:metadata name="PublicationYear">1900</goobi:metadata>
<goobi:metadata name="singleDigCollection">Saxonica</goobi:metadata>
<goobi:metadata name="singleDigCollection">Projekt: Sächsische Adressbücher</goobi:metadata>
<goobi:metadata name="shelfmarksource">Hist.Sax.H.929-1900</goobi:metadata>
</goobi:goobi>
</mods:extension>
</mods:mods>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
In diesem Element werden die deskriptiven Metadaten (Monografie, Zeitschriften-Band, ...) gespeichert, die im Metadateneditor eingegeben wurden.
Das Element ist als DMDLOG_0002
, DMDLOG_0003
, DMDLOG_0004
, ... bezeichnet.
Beispiel:
<mets:dmdSec ID="DMDLOG_0002">
<mets:mdWrap MDTYPE="MODS">
<mets:xmlData>
<mods:mods>
<mods:extension>
<goobi:goobi>
<goobi:metadata name="TitleDocMain">Inhalts-Verzeichnis</goobi:metadata>
</goobi:goobi>
</mods:extension>
</mods:mods>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
<mets:dmdSec ID="DMDLOG_0003">
…
<mets:dmdSec ID="DMDLOG_0085">
<mets:mdWrap MDTYPE="MODS">
<mets:xmlData>
<mods:mods>
<mods:extension>
<goobi:goobi>
<goobi:metadata name="TitleDocMain">Thalia-Theater zu Chemnitz</goobi:metadata>
<goobi:metadata name="slub_Place">Chemnitz</goobi:metadata>
<goobi:metadata name="slub_PlaceSWDID">4029702-0</goobi:metadata>
</goobi:goobi>
</mods:extension>
</mods:mods>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
Dieser Bereich enthält den Pfad zu dem Speicherort der Images.
Das Element ist als DMDPHYS_0000
bezeichnet.
Beispiel:
<mets:dmdSec ID="DMDPHYS_0000">
<mets:mdWrap MDTYPE="MODS">
<mets:xmlData>
<mods:mods>
<mods:extension>
<goobi:goobi>
<goobi:metadata name="pathimagefiles">
file:///home/goobi/work/daten/37571/images/adredefau_20052145Z_1900_tif
</goobi:metadata>
</goobi:goobi>
</mods:extension>
</mods:mods>
</mets:xmlData>
</mets:mdWrap>
</mets:dmdSec>
Dieser Bereich enthält die Pfade zu den einzelnen Images.
Weitere Informationen zur <fileSec>
finden sich unter: http://www.loc.gov/standards/mets/METSOverview.v2.html#filegrp
Beispiel:
<mets:fileSec>
<mets:fileGrp USE="LOCAL">
<mets:file ID="FILE_0000" MIMETYPE="image/tiff">
<mets:FLocat LOCTYPE="URL" xlink:href="file:///home/goobi/work/daten/37571/images/scans_tif/00000001.tif"/>
</mets:file>
…
<mets:file ID="FILE_1583" MIMETYPE="image/tiff">
<mets:FLocat LOCTYPE="URL" xlink:href="file:///home/goobi/work/daten/37571/images/scans_tif/00001350.tif"/>
</mets:file>
</mets:fileGrp>
</mets:fileSec>
Dieser Bereich enthält die erstellten Strukturelemente des Vorgangs. Sie werden in einer Baumstruktur dargestellt, so dass Kindelemente "geschachtelt" werden.
Weitere Informationen zur <structMap>
finden sich unter: http://www.loc.gov/standards/mets/METSOverview.v2.html#structmap
Beispiel:
<mets:structMap TYPE="LOGICAL">
<mets:div ID="LOG_0002" TYPE="Periodical">
<mets:mptr LOCTYPE="URL" xlink:href="" xmlns:xlink="http://www.w3.org/1999/xlink"/>
<mets:div DMDID="DMDLOG_0001" ID="LOG_0003" TYPE="PeriodicalVolume">
<mets:div ID="LOG_0004" TYPE="TitlePage"/>
<mets:div DMDID="DMDLOG_0002" ID="LOG_0005" TYPE="TableOfContents"/>
...
<mets:div DMDID="DMDLOG_0079" ID="LOG_0082" TYPE="PeriodicalPart">
<mets:div DMDID="DMDLOG_0080" ID="LOG_0083" TYPE="OtherDocStrct"/>
<mets:div DMDID="DMDLOG_0081" ID="LOG_0084" TYPE="OtherDocStrct"/>
...
<mets:div DMDID="DMDLOG_0085" ID="LOG_0088" TYPE="PeriodicalPart"/>
</mets:div>
</mets:div>
</mets:structMap>
Dieser Bereich enthält die Informationen zur Paginierung der einzelnen Images.
Weitere Informationen zur <structMap>
finden sich unter: http://www.loc.gov/standards/mets/METSOverview.v2.html#structmap
Beispiel:
<mets:structMap TYPE="PHYSICAL">
<mets:div DMDID="DMDPHYS_0000" ID="PHYS_0000" TYPE="BoundBook">
<mets:div ID="PHYS_0001" ORDER="1" ORDERLABEL="uncounted" TYPE="page">
<mets:fptr FILEID="FILE_0000"/>
</mets:div>
<mets:div ID="PHYS_0002" ORDER="2" ORDERLABEL="uncounted" TYPE="page">
<mets:fptr FILEID="FILE_0001"/>
</mets:div>
...
<mets:div ID="PHYS_0030" ORDER="30" ORDERLABEL="XXVI" TYPE="page">
<mets:fptr FILEID="FILE_0029"/>
</mets:div>
...
<mets:div ID="PHYS_0578" ORDER="578" ORDERLABEL="544" TYPE="page">
<mets:fptr FILEID="FILE_0577"/>
</mets:div>
...
<mets:div ID="PHYS_1350" ORDER="1350" ORDERLABEL="uncounted" TYPE="page">
<mets:fptr FILEID="FILE_1349"/>
</mets:div>
</mets:div>
</mets:structMap>
Dieser Bereich enthält die Informationen darüber, welche Images zu welchen Strukturelementen gehören.
Weitere Informationen zur <structLink>
finden sich unter: http://www.loc.gov/standards/mets/METSOverview.v2.html#structlink
Beispiel:
<mets:structLink>
<mets:smLink xlink:to="PHYS_0001" xlink:from="LOG_0003"/>
<mets:smLink xlink:to="PHYS_0002" xlink:from="LOG_0003"/>
<mets:smLink xlink:to="PHYS_1347" xlink:from="LOG_0087"/>
<mets:smLink xlink:to="PHYS_1347" xlink:from="LOG_0088"/>
</mets:structLink>
Wenn Strukturelemente und deren Metadaten kopiert werden sollen, werden Änderungen an zwei Stellen vorgenommen:
-
Metadaten der Strukturelemente
DMDLOG_0002
,DMDLOG_0003
,DMDLOG_0004
, ... -
Strukturelemente
<structMap> / LOGICAL
Alle anderen Elemente (Paginierung, ...) sollten nicht verändert werden, da diese in der Regel in jedem Band voneinader abweichen.
Beim Kopieren und Einfügen muss zudem darauf geachtet werden, dass bestehende Elemente korrekt überschrieben werden.