Allgemeines zur GND

Die bibliothekarische Inhaltserschließung basiert im Grunde auf 2 Säulen:
In der GND wurden 2012 die bisherigen Normdateien PND (Personennamendatei), GKD (Gemeinsame Körperschaftsdatei), SWD (Schlagwortnormdatei) und EST (Einheitssachtitel des Deutschen Musikarchivs) zusammengeführt. Die frühere Differenzierung in Normdaten für die Formalerschließung und Normdaten für die Sacherschließung wurde damit aufgegeben. Heute gibt es pro Entität einen Datensatz, der in beiden Kontexten genutzt werden kann.

Zur Erschließungs- bzw. Vergabepraxis


Die DNB erprobt parallel Verfahren, mit denen Schlagwörter automatisiert vergeben werden können.

Zur GND im Kontext von Normalisierung und Datenaustausch

Bibliotheken haben schon recht früh damit begonnen, ihre Erschließungsdaten untereinander auszutauschen. Hierzu braucht es ein einheitliches (Austausch-)Format (MARC) und ein Vokabular (GND), das Bezeichnungen vereinheitlicht und gleichzeitig das Problem von Synonymen, Homonymen usw. behebt.
Seit einigen Jahren werden Daten nicht mehr nur zwischen Bibliotheken ausgetauscht, sondern auch zwischen verschiedenen Kultur- und Wissenseinrichtungen. Im Zuge dessen wird die GND, als eine Quelle von Normdaten, auch verstärkt von Archiven, Museen usw. eingesetzt; sie ist so für die digital humanities grundsätzlich relevant geworden. (Vgl. hierzu das GND4C-Projekt: https://www.dnb.de/DE/Professionell/ProjekteKooperationen/Projekte/GND4C/gnd4c.html)
Die Verwendung von Normdaten, speziell der GND, ermöglicht es Datenaggregatoren wie der Deutschen Digitalen Bibliothek, oder bavarikon, Objekte aus verschiedenen Sparten miteinander zu verknüpfen und damit ihre Auffindbarkeit zu verbessern.
Welchen Vorteil die GND in diesem Kontext bietet, lässt sich an einem (fingierten) Beispiel veranschaulichen:
In bavarikon gibt es z.B. ein Porträt von Martin Luther und gleichzeitig eine Münze mit dem Konterfei Martin Luthers. Beide Objekte haben Martin Luther als „Thema“; Sie können jedoch nur dann (auf einfachem Wege) vom System miteinander in Beziehung gesetzt werden, wenn in beiden Fällen im Feld dc:subject nicht nur ein String eingetragen ist, sondern ein eindeutiger Identifikator, wie z.B. die GND-ID (118575449). Werden statt eines Identifikators Strings verwendet, ist es gut möglich, dass diese voneinander abweichen, d.h. in diesen Fällen wäre zwar die gleiche Person gemeint, ihre Bezeichner würden sich jedoch unterscheiden. Dass dies gar nicht so unwahrscheinlich ist, verdeutlicht ein Blick auf die Spalte „Andere Namen“ des GND-Datensatzes:
http://d-nb.info/gnd/118575449. Einem Menschen fällt es nicht schwer, die (leicht) voneinander abweichenden Strings zusammenzuführen, für eine Maschine ist dies dagegen ein größeres Hindernis.

Zur GND im Kontext von Linked Data

Obwohl die GND mittlerweile auch vermehrt außerhalb von Bibliotheken eingesetzt wird, ist das Format der GND-Datensätze, MARC, stark domänenspezifisch und wird außerhalb der Bibliothekswelt nicht verwendet. Die GND Ontologie stellt einen Versuch dar, diese Lücke zu schließen, um die GND auch für die Verwendung im Semantic Web einsatzfähig zu machen, denn:

„The need for name disambiguation and entries having an authoritative character is an issue that concerns a lot more communities than the library world. In a growing information society the unique identification and linking of persons, places and other authorities becomes more and more important. The GND Ontology aims to transfer the made experience from libraries to the web community by providing a vocabulary for the description of conferences or events, corporate bodies, places or geographic names, differentiated persons, undifferentiated persons (name of undifferentiated persons), subject headings, and works.“
Eine Ontologie besteht aus den folgenden Komponenten:

Ein Vorteil von Linked Data ist, dass die codierte Information sprachunabhängig ist. Im obigen Beispiel wird das durch den Begriff Butter repräsentierte Objekt, oder anders ausgedrückt, das real world object BUTTER, durch Properties (Eigenschaften) näher beschrieben. Der String Butter taucht zwar in der RDF-Datei auch auf, aber nur als ein Property der Ressource Butter:
<gndo:preferredNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Butter</gndo:preferredNameForTheSubjectHeading> In einem Anwendungsfall, in dem man zusätzlich zum deutschen Begriff Butter die italienische Entsprechung bräuchte, könnte man hierfür einfach ein weiteres Triple (RDF basiert auf Triplen) bilden, z.B. bestehend aus der Ressource http://d-nb.info/gnd/4009236-7 als Subjekt, rdfs:label xml:lang=“it“ als Prädikat und dem Literal (String) burro.

Angenommen die Biblioteca nazionale Firenze würde mit ihrem Nuovo Soggetario Thesaurus ähnlich verfahren wie die DNB mit der GND, könnte man die Ressource Butter in der GND mit der Ressource burro im Nuovo Soggetario Thesaurus z.B. über die Property owl:sameAs in Verbindung setzen, um auszudrücken, dass in beiden Fällen das gleiche real world object BUTTER beschrieben wird.
Mit dem Property <skos:broadMatch rdf:resource="http://zbw.eu/stw/descriptor/14957-0"/> wird z.B. die GND-Ressource Butter mit der ZBW-Ressource Streichfett in Beziehung gesetzt.