Allgemeines zur GND
Die bibliothekarische Inhaltserschließung basiert im Grunde auf 2 Säulen:
- Mittels Klassifikationen lässt sich eine (grobe) inhaltliche Einordnung vornehmen (DDC) und z.B. auch die Aufstellung von Literatur in Freihandbeständen organisieren (RVK).
- Durch die Vergabe von Schlagwörtern bzw. Schlagwortketten (nicht mehr en vogue) lässt sich der Inhalt eines Werkes detaillierter beschreiben (GND).
In der GND wurden 2012 die bisherigen Normdateien PND (Personennamendatei), GKD (Gemeinsame Körperschaftsdatei), SWD (Schlagwortnormdatei) und EST (Einheitssachtitel des Deutschen Musikarchivs) zusammengeführt. Die frühere Differenzierung in Normdaten für die Formalerschließung und Normdaten für die Sacherschließung wurde damit aufgegeben. Heute gibt es pro Entität einen Datensatz, der in beiden Kontexten genutzt werden kann.
Zur Erschließungs- bzw. Vergabepraxis
- Formalerschließer, d.h. Bibliothekare, die die formalen Metadaten einer Ressource erfassen, wie z.B. Autor, Titel, Erscheinungsjahr, usw., sind dazu angehalten, zumindest die mit der Ressource in Verbindung stehenden Personen (z.B. Autor, Herausgeber, gefeierte Person usw.) mit einem Eintrag in der GND zu verknüpfen. Auf diese Weise wird die Person eindeutig identifiziert. Ist eine Person noch nicht in der GND hinterlegt, wird eine neue Personen-Entität angelegt. Hierzu wird ein vorgegebenes Set an identifizierenden Informationen (z.B. Lebensdaten, Beruf, zugeordnete Einrichtung usw.) erfasst, das, wenn möglich, der vorliegenden Ressource entnommen wird. Eine einschlägige Informationsquellen ist aber z.B. auch der auf einer Institutsseite veröffentlichte Lebenslauf der Person.
- Sacherschließer sind Bibliothekare, die den Inhalt einer Ressource erschließen. Hierbei stützen sie sich auf den Titel der Ressource, aber nicht ausschließlich. Nicht selten haben Ressourcen recht kunstvoll gestaltete Überschriften, die keinerlei Rückschluss auf den eigentlichen Inhalt zulassen. Sacherschließer gehen daher normalerweise so vor, dass sie sich anhand der Überschrift, des Klappentexts, des Inhaltsverzeichnisses, des Vorworts, der Einleitung, des Schlusses usw. einen Überblick über den Inhalt verschaffen. Anschließend fassen sie diesen in einer Handvoll Schlagwörtern zusammen. Für die Recherche nach geeigneten Schlagwörtern eignet sich z.B. die OGND.
Die DNB erprobt parallel Verfahren, mit denen Schlagwörter automatisiert vergeben werden können.
Zur GND im Kontext von Normalisierung und Datenaustausch
Bibliotheken haben schon recht früh damit begonnen, ihre Erschließungsdaten untereinander auszutauschen. Hierzu braucht es ein einheitliches (Austausch-)Format (MARC) und ein Vokabular (GND), das Bezeichnungen vereinheitlicht und gleichzeitig das Problem von Synonymen, Homonymen usw. behebt.
Seit einigen Jahren werden Daten nicht mehr nur zwischen Bibliotheken ausgetauscht, sondern auch zwischen verschiedenen Kultur- und Wissenseinrichtungen. Im Zuge dessen wird die GND, als eine Quelle von Normdaten, auch verstärkt von Archiven, Museen usw. eingesetzt; sie ist so für die digital humanities grundsätzlich relevant geworden. (Vgl. hierzu das GND4C-Projekt: https://www.dnb.de/DE/Professionell/ProjekteKooperationen/Projekte/GND4C/gnd4c.html)
Die Verwendung von Normdaten, speziell der GND, ermöglicht es Datenaggregatoren wie der Deutschen Digitalen Bibliothek, oder bavarikon, Objekte aus verschiedenen Sparten miteinander zu verknüpfen und damit ihre Auffindbarkeit zu verbessern.
Welchen Vorteil die GND in diesem Kontext bietet, lässt sich an einem (fingierten) Beispiel veranschaulichen:
In bavarikon gibt es z.B. ein Porträt von Martin Luther und gleichzeitig eine Münze mit dem Konterfei Martin Luthers. Beide Objekte haben Martin Luther als „Thema“; Sie können jedoch nur dann (auf einfachem Wege) vom System miteinander in Beziehung gesetzt werden, wenn in beiden Fällen im Feld dc:subject nicht nur ein String eingetragen ist, sondern ein eindeutiger Identifikator, wie z.B. die GND-ID (118575449). Werden statt eines Identifikators Strings verwendet, ist es gut möglich, dass diese voneinander abweichen, d.h. in diesen Fällen wäre zwar die gleiche Person gemeint, ihre Bezeichner würden sich jedoch unterscheiden. Dass dies gar nicht so unwahrscheinlich ist, verdeutlicht ein Blick auf die Spalte „Andere Namen“ des GND-Datensatzes:
http://d-nb.info/gnd/118575449. Einem Menschen fällt es nicht schwer, die (leicht) voneinander abweichenden Strings zusammenzuführen, für eine Maschine ist dies dagegen ein größeres Hindernis.
Zur GND im Kontext von Linked Data
Obwohl die GND mittlerweile auch vermehrt außerhalb von Bibliotheken eingesetzt wird, ist das Format der GND-Datensätze, MARC, stark domänenspezifisch und wird außerhalb der Bibliothekswelt nicht verwendet. Die GND Ontologie stellt einen Versuch dar, diese Lücke zu schließen, um die GND auch für die Verwendung im Semantic Web einsatzfähig zu machen, denn:
„The need for name disambiguation and entries having an authoritative character is an issue that concerns a lot more communities than the library world. In a growing information society the unique identification and linking of persons, places and other authorities becomes more and more important. The GND Ontology aims to transfer the made experience from libraries to the web community by providing a vocabulary for the description of conferences or events, corporate bodies, places or geographic names, differentiated persons, undifferentiated persons (name of undifferentiated persons), subject headings, and works.“
Eine Ontologie besteht aus den folgenden Komponenten:
- Konzepte/Klassen fassen real existierende Instanzen mit gemeinsamen Eigenschaften zusammen; z.B. „Schlagwort“;
- Instanzen/Begriffe, welche die eigentlichen Objekte darstellen, z.B. Butter, identifiziert durch die globale URI http://d-nb.info/gnd/4009236-7;
- Relationen verbinden Konzepte und Instanzen miteinander; z.B. wird Butter über folgendes Konstrukt als ein Objekt der Klasse „SubjectHeadingSensoStricto“ (einer Unterklasse der Klasse Schlagwort) ausgewiesen:<rdf:Description rdf:about="http://d-nb.info/gnd/4009236-7"><rdf:type rdf:resource="http://d-nb.info/standards/elementset/gnd#SubjectHeadingSensoStricto"/ß> (vgl. http://d-nb.info/gnd/4009236-7/about/rdf).
Ein Vorteil von Linked Data ist, dass die codierte Information sprachunabhängig ist. Im obigen Beispiel wird das durch den Begriff Butter repräsentierte Objekt, oder anders ausgedrückt, das real world object BUTTER, durch Properties (Eigenschaften) näher beschrieben. Der String Butter taucht zwar in der RDF-Datei auch auf, aber nur als ein Property der Ressource Butter:
<gndo:preferredNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Butter</gndo:preferredNameForTheSubjectHeading>
In einem Anwendungsfall, in dem man zusätzlich zum deutschen Begriff Butter die italienische Entsprechung bräuchte, könnte man hierfür einfach ein weiteres Triple (RDF basiert auf Triplen) bilden, z.B. bestehend aus der Ressource http://d-nb.info/gnd/4009236-7 als Subjekt, rdfs:label xml:lang=“it“ als Prädikat und dem Literal (String) burro.
Angenommen die Biblioteca nazionale Firenze würde mit ihrem Nuovo Soggetario Thesaurus ähnlich verfahren wie die DNB mit der GND, könnte man die Ressource Butter in der GND mit der Ressource burro im Nuovo Soggetario Thesaurus z.B. über die Property owl:sameAs in Verbindung setzen, um auszudrücken, dass in beiden Fällen das gleiche real world object BUTTER beschrieben wird.
Mit dem Property <skos:broadMatch rdf:resource="http://zbw.eu/stw/descriptor/14957-0"/> wird z.B. die GND-Ressource Butter mit der ZBW-Ressource Streichfett in Beziehung gesetzt.Deutsche Nationalbibliothek
Vergleiche
Identifikationsnummer
vergleiche