Seit geraumer Zeit werden die Metadaten immer wieder genannt. Doch nur eine (geschätzte) Hälfte der Leser weiß auch worum es sich wirklich handelt und warum man es braucht. Um es auf einem konkreten Beispiel zu erklären, möchte ich die bibliographische Metadaten samt einer leicht verständlichen Definition vorstellen.
Das Wort „bibliogaphisch“ meint ursprünglich Bücher, des weiteren gedruckte Werke und – spätestens seit dem Computerzeitalter (sprich: PDF, HTML, eBooks) – „literarische“ Werke überhaupt.
Metadaten sind – grob gesagt – Angaben zu einem bestimmten etwas. Mit dem „meta“ kling auch das altgriechische „über“ an. Es Daten (Angaben) über andere Daten (Inhalte). So ist bei einem Buch der Titel, der Autorenname sowie eine literarische Gattung eine hilfreiche Beschreibung des speziellen Buches. Weil ein Buch in vielen Verlagen und auf unterschiedlichen Medien (Print, eBook, Hörbuch) erscheinen kann, beziehen sich einige dieser Daten auf das Werk selbst. Einige nur auf dessen konkrete Ausgestaltung wie Medientyp, Ausgabe, Übersetzung oder konkretes Exemplar in der Bibliothek.
Diese hierarchisch aufeinander aufbauende Struktur der Metadaten wurde unter dem Namen Functional Requirements for Bibliographic Records (FRBR) zu deutsch: funktionale Anforderungen an bibliographische Eintragungen (?) von der IFLA (International Federation of Library Associations and Institutions) erarbeitet.
Neben der Art der Metadaten, die für unterschiedliche Konkretisierung eines Werkes gelten, gibt es weitere Kategorien, in die man Metadaten unterteilen kann:
- Funktion:
- Als Nachweis der Existenz (wichtig für Verlage, das Verzeichnis lieferbarer Bücher oder nationale, internationale oder sachbezogene Bibliographien [z.B.: die Deutsche Nationalbibliothek, PubMed])
- Als Nachweis der Quelle aus der zitiert wurde bzw. auf die man sich im eigenen Werk bezieht [z.B.: Quellenangaben in Fußnoten]
- Als Nachweis der Existenz in einer bestimmten Bibliothek (die Bibliothek der Universität des Saarlandes besitzt das Buch XYZ – ein Exemplar davon hat die konkrete Katalog-Nummer 123456)
- Als Nachweis der Relevanz eines Werkes für ein bestimmtes Fachgebiet (Bibliographien für die Nietzsche-Rezeption im deutschsprachigen Raum = „Wer hat was über die Person und die Werke Nietzsches geschrieben?“)
- Die Darstellung:
- Als Quellenangaben (in Deutschland – hoffentlich – nach DIN 1505-2 formatiert: meistens als Fußnoten oder seltener als Endnoten [im Anhang einer Arbeit])
- Als formatierte Metadaten: bestimmte Daten werden bestimmten Datenfeldern eines Formates zugeordnet und können so gut unterschieden und z.B. zu Quellenangaben verarbeitet werden. Je nach Format gelingt das mehr oder weniger gut. Sehr engmaschige Formate (mit atomarer Feldstruktur) wie ONIX for books sind viel genauer als die etwas veralteten MARC-Formate (sowie deren XML-Abbildung namens MODS) oder das TeX-bezogene BibTeX-Format.
- Identifikatoren. (Ja diese sind auch Metadaten!) Dazu gehören: die URLs (sowie URIs überhaupt), ISBN, ISSN (oder das neue ISSN-L) aber auch das DOI (Digital Object Identifier).
- Ort der Metadaten:
- Externe Metadaten: Die Metadaten liegen Ausserhalb des Werkes (wie: Daten in der Datenbank – das Buchexemplar im Regal)
- Interne Metadaten: Die Metadaten befinden sich im Werk selbst. Denken Sie an ID3-Tags in mp3-Dateien, EXIF, XMP oder IPTC in Bildern. Auch die Office-Dateien beinhalten zum Teil Metadaten (Autor, Titel, Computername – auf dem eine Datei geschrieben wurde, Lizenzen [bei DRM oder PDF] etc). Zusätzlich entstehen immer mehr Formate, die den Inhalt an bestimmten Stellen des Werkes beschreiben: beispielsweise Name der Person, die im Film in genau dem Moment gezeigt wird oder sehr einfach die aktuelle Sprache des HTML-Textes (lang-Attribut).
Die Metadaten sind aus unserem Alltag nicht wegzudenken. Ohne sie würden wir sozusagen im Chaos versinken. Je besser und genauer diese sind, umso leichter ist es, die damit beschriebenen Werke zu finden, sie zu zitieren oder sich in diesen schnell und genau zu bewegen.