Home    Kalender    Suche    A bis Z  
Bibliothek
Forschung
Museum und
Kulturprogramm
Publikationen
Wir über uns
 

Strukturelle Metadaten

Strukturdaten dienen der Naviagtion im digitalen Faksimile, können aber auch zur Indexierung in einer Datenbank herangezogen werden. Sie werden im jeweiligen Verzeichnis unter dem Namen tei-struct.xml abgelegt. Die Anlage folgt der Idee, dass es sich um den Volltext handelt, in dem außer den struktruellen Elementen oder Textauszügen alles übrige weggelassen wurde. Insofern stimmt ein Volltext mit einer Strukturdatendatei im Prinzip immer überein und beide sind theoretisch durch Vervollständigen oder Weglasssen ineinander überführbar.

Strukturdatenerschließung mit <index> und <div>

Für die strukturelle inhaltliche Beschreibung werden das <div> und die Kombination der Elemente von <index><term> der TEI verwendet. Korrespondierende Images werden in beiden Elementen sowie im <pb> Element mit dem in der TEI P5 eingeführten Attribut @facs referenziert, das auf einen facsimile-Block (s.a. TEI Dokumentation ) verweist. S. hierzu in der Dokumentation Digitale Faksimiles. Zu beachten ist, dass ein pagebreak <pb> immer innerhalb einer logischen Einheit, z.B. <p>, gesetzt wird und den Beginn einer Seite kennzeichnet. In <head> werden Überschriften oder wichtige Strukturelemente kodiert. Ggf. können auch innerhalb von <p> Textauszüge stehen. Es gilt folgendes Grundschema:

<div type=[normierte Form]>
 <head>[Transkription Überschrift]</head>
  <p>[Transkription Textauszüge]
    <pb facs=[Seiten ID] n=[Foli- oder Paginierungen]/> 
<index indexName=[normierter Form] facs=[Seiten ID]> <term xml:lang="de" key="[Nummernschlüssel]" target="#[gattungsspezifischer Normbergriff]">
[Begriff] <orig>[Vorlageform]</orig> </term>
<index indexName="fsw" facs="[Seiten ID]> <term xml:lang="de" target="#[gattungsspezifischer Normbergriff]"> [Formbegriff/allg. Beschreibung des übergeordneten term Elements] </term
</index>
</index>

Um <div> und <index><term> zu differenzieren, erhalten sie im @type bzw. @indexName und @target Attribut festgelegte Werte (<div type="[normierter Wert]"> und <index indexName="[normierter Wert]"><term target="[normiert Wert]">). Die Standardwerte in @type und @target folgen der auf der Seite des DFG Viewers veröffentlichten Liste der Strukturdaten (siehe Spalte XML Viewer). Nach Bedarf können aber Präzisierungen oder auch projektbezogen Fachvokabulare aus vorgegebenen Schlagwortlisten hinzutreten. Diese Listen werden in separaten Dateien als als taxonomy Block (vgl. TEI Dokumentation) abgelegt. Sie können entweder in den TEI-Header der jeweiligen Dokumente integriert (bisher nicht praktiziert) oder aber per XSLT eingebunden werden. Die Standardstrukturdatenliste ist hier verfügbar. Weitere gattungs- oder materialtypische Listen finden sich hier.

Die Werte der Strukturliste können entweder in <div> oder in <index> verwendet werden. Der Unterschied beider ist innerhalb der Strukturdatendatei mitunter fließend. <div> kennzeichnet eher Text- oder Gegenstandsbereiche mit einer gewissen Erstreckung, während mit <index> eher punktuelle Objekte kodiert werden, z.B. ist ein Buchspiegel einerseits ein für das virtuelle Register punktuelles Phänomen, wenn er aber Text enthält möglicherweise auch ein Container. <index> ist dem Textfluß enthoben und bezeichnet den bloßen Registerbegriff, <div> repräsentiert einen Gliederungsabschnitt des Textes. In beiden ist die Belegung des @facs Attributs verpflichtend. Dies ist zwar redundant zu <pb @facs="">, doch wird so die spätere Extraktion und/oder XSLT Konvertierung wesentlich erleichtert.

<div type="introduction" facs="#drucke_nh-276_00007" n="iii">
 <head>Prolegomena de insectis</head>
 <p>
<pb facs="#drucke_nh-276_00007" n="iii"/>
  <index indexName="fsw" facs="#drucke_nh-276_00007" n="iii">
    <term type="structure" target="#illustration" xml:lang="de">Illustration</term>
  </index>
  <index indexName="fsw" facs="#drucke_nh-276_00008" n="iv">
    <term type="structure" target="#illustration" xml:lang="de">Illustration</term>
  </index>
...
</div>
  

<index> erlaubt als leeres, nahezu überall verwendbares Element eine sehr flexible Nutzung. Es wird in der Digitalen Bibliothek zur Kodierung insbesondere von Sach-, Personen-, Orts-, Sach-, Zeit- oder Formschlagworten verwendet.

In @indexName wird die Art des Registerbegriffs spezifiziert. Der Wert "fsw" z.B. bedeutet, dass es sich um ein Formschlagwort handelt, hier die Standardliste der Strukturdaten. @indexName erlaubt nach den Kriterien von Person (psw), Ort (osw), Sachbetreff (stw), Zeit (zsw), Form (fsw) und weiteren Registerbegriffe über eine bestimmte Facette zu aggregieren und selektiv zu durchsuchen. Thesauri und normierte Schlagwortlisten werden in @target im <term> Element verzeichnet. Im @type Attribute wird die Art des Indexbegriffs notiert (s. Liste). Ein Sonderfall sind Zitate, die mit @cRef kodiert werden (s. a, Zitate; vgl. http://diglib.hab.de/inkunabeln/80-6-quod-3/tei-struct.xml). Obwohl es beim Vorhandensein von @target strenggenommen nicht erforderlich ist, weil die Anzeige über den Identifier in @target aus der Schlagwortliste generiert wird, sollte die Ansetzungsform zum Zwecke der besseren Lesbarkei und Findbarkeit durch Suchmaschienen, hier Illustration, notiert werden; sinnvoll ist es darüber hinaus auch die Sprache der Ansetzungsform mit @xml:lang zu vermerken. @facs ist verpflichtend und verbindet den Indexbegriff mit den Faksimile. @n kann fakultativ für die logische Seitenzählung (Paginierung, Foliierung) dazutreten.

<index indexName="stw" facs="drucke_197-15-hist_00024">
  <term type="festival" target="#F0910" xml:lang="de">Leichenbegängnis</term>
</index>

Wenn <index> nicht nur als reine Strukturinformation, sondern innerhalb von Fließtext genutzt werden soll, kann <index> innerhalb von <term> verwendet werden. Diese Form kommt aber nur für Sachbegriffe in Betracht:

...der am Tage der Fürstlichen <term>Leichbegängnuß<index indexName="stw" facs="drucke_197-15-hist_00024"><term type="Festelement" target="#F0910" xml:lang="de"> Leichenbegängnis
</term></index></term> ...

Personen werden im Fließtext bzw. Volltext (tei-transcript.xml) mit <rs type="person">, Orte mit <rs type="place"> ausgezeichnet (siehe Namen).

Notationen oder Schlüssel werden im @key Attribut des <term>-Elementes notiert. Bei Personen (indexName="psw") ist dies grundsätzlich die PND Nummer mit einem Präfix "PND_", z.B. key="PND_123456"; wenn die Person zentral nachgewiesen wird, sollte die PND Nummer auch dort notiert werden (s.Namen). Zusätzlich zur Notation kann, wenn die Nummer, ggf. mit Präfix, nicht evident ist und eine Erläuterung angezeigt werden soll, ein allgemeiner Begriff zur Erläuterung geschachtelt in einem weiteren <index> Element angegeben werden, hier "ICONCLASS"); dieses Indexelement erhält grundsätzlich das Attribut @indexName='fsw'. Das geschachtelte Element wird darüber hinaus grundsätzlich für einen die allgemeine Funktion des Termes erläuternden Begriff verwendet (s. auch folgendes Beispiel "Widmender"):

<index indexName="notation" facs="#drucke_gm-4f-411_00026">
   <term xml:lang="de" key="32B32(MOOR)">Mohr</term>
<index indexName="fsw" facs="#drucke_gm-4f-411_00026"> <term xml:lang="de">ICONCLASS</term>
</index>

</index>

(aus: http://diglib.hab.de/drucke/gm-4f-411/tei-struct.xml)

Wenn neben dem Schlagwort in <term> auch eine Vorlageform notiert werden soll, besteht die Möglichkeit <orig> innerhalb von <term>zu verwenden:

<index indexName="psw" facs="#drucke_gm-4f-256_00011">
<term xml:lang="de">
Curicke, Georg Reinhold
<orig>G. R. C.</orig>
</term>
<index indexName="fsw" facs="#drucke_gm-4f-256_00011">
<term xml:lang="de" type="structure" target="#dedicator"> Widmender </term>
</index>
</index>

(aus: http://diglib.hab.de/drucke/gm-4f-256/tei-struct.xml)

 

Anmerkungen in Strukturdaten mit <note>

Neben Abschnitten <div> und Registerbegriffen <index> können in Strukturdaten auch Anmerkungen auftreten. Diese werden nicht weiter spezifiziert und enthalten beliebige Kommentare oder Verweise zur Textstelle. Fakulativ kann der Anmerkende in @resp genannt werden. @facs muss angegeben werden, um deutlich zu machen, auf welche Seite sich die Anmerkung bezieht.

            <note facs="#drucke_xy123456_00056" resp="TS">
Beliebige Anmerkung </note>

Eine Besonderheit sind Anmerkungen mit bibliographischen Hinweisen. Diese werden nach den allgemeinen Regeln gebildet (s. bibliographische Nachweise) und in <bibl> eingeschlossen. Für den vollständigen Literaturnachweis muss ein Pointer mit angegeben werden, der via PPN in den OPAC verweist, z.B.

             <note facs="#drucke_gm-2f-156_00056">
                   Gedicht, s.
<bibl> Woods/Fürstenwald Nr. 120 <ptr type="opac" cRef="026450836"/> </bibl>
</note>

(aus: http://diglib.hab.de/drucke/gm-2f-156/tei-struct.xml)

zurück
zum Seitenanfang

Zuletzt geändert am 9. Januar 2010
© HAB Wolfenbüttel - URL: http://www.hab.de/ - Impressum