Généralités sur le GND

Le catalogage dans le domaine bibliothécaire se base essentiellement sur deux piliers :
En 2012, les anciens notices d’autorité PND (Personennamendatei – fichiers nom de personne), GKD (Gemeinsame Körperschaftsdatei – fichiers communs de l’organisme), SWD (Schlagwortnormdatei – fichiers mots-clés) et EST (Einheitssachtitel des Deutschen Musikarchivs – article détaillé de l’archive de musique allemande) ont été réunis dans le GND. L'ancienne différenciation entre les notices d’autorité pour le catalogage descriptif et les notices d’autorité pour la description matérielle a ainsi été abandonnée. Aujourd'hui, il existe un jeu de données par entité qui peut être utilisé dans les deux contextes.

Sur la pratique du catalogage et de l'attribution


La DNB teste en parallèle des procédures permettant d'attribuer des mots-clés de manière automatisée.

Sur le GND dans le contexte de la normalisation et de l'échange de données

Les bibliothèques ont commencé assez tôt à échanger entre elles leurs données de catalogage. Pour ce faire, il faut un format (d'échange) uniforme (MARC) et un vocabulaire (GND) qui uniformise les désignations et résout en même temps le problème des synonymes, homonymes, etc.
Depuis quelques années, les données ne sont plus seulement échangées entre bibliothèques, mais aussi entre différentes institutions culturelles et de connaissances. Dans le cadre de cette évolution, le GND, en tant que source de notices d’autorité, est de plus en plus utilisé par les archives, les musées, etc.; et est ainsi devenu fondamentalement pertinent pour les digital humanities. (Voir à ce sujet le projet GND4C : https://www.dnb.de/DE/Professionell/ProjekteKooperationen/Projekte/GND4C/gnd4c.html)
L'utilisation de notices d’autorité, en particulier du GND, permet à des agrégateurs de données tels que la Deutsche Digitale Bibliothek (bibliothèque numérique allemande) ou bavarikon de relier entre eux des objets de différents domaines et d'en améliorer ainsi la visibilité et l’accessibilité.
Un exemple (fictif) permet d'illustrer l'avantage qu'offre la GND dans ce contexte :
Dans bavarikon, il y a par exemple un portrait de Martin Luther et en même temps une pièce de monnaie avec le portrait de Martin Luther. Les deux objets ont Martin Luther comme "sujet" ; ils ne peuvent toutefois être mis en relation (de manière simple) par le système que si, dans les deux cas, le champ dc:subject ne contient pas seulement une chaîne de caractères, mais un identificateur univoque, comme par exemple l'ID GND (118575449). Si des chaînes de caractères sont utilisées au lieu d'un identifiant, il est fort possible qu'elles diffèrent les unes des autres. C'est-à-dire que dans ce cas, il s'agirait certes de la même personne, mais que ses identifiants seraient différents. Un coup d'œil à la colonne "Andere Namen" (fr. autres noms) du jeu de données GND montre que cela n'est pas si improbable :
http://d-nb.info/gnd/118575449. Pour un être humain, il n'est pas difficile de réunir des chaînes (légèrement) différentes, mais pour une machine, c'est un obstacle plus important.

Sur le GND dans le contexte du Linked Data

Bien que la GND soit désormais de plus en plus utilisée en dehors des bibliothèques, le format des enregistrements GND, MARC, reste très spécifique aux domaines concernés et n’est pas utilisé en dehors des bibliothèques. L’ ontologie GND eprésente une tentative de combler cette lacune pour rendre la GND également opérationnelle pour son emploi dans le Web sémantique, puisque :

„The need for name disambiguation and entries having an authoritative character is an issue that concerns a lot more communities than the library world. In a growing information society the unique identification and linking of persons, places and other authorities becomes more and more important. The GND Ontology aims to transfer the made experience from libraries to the web community by providing a vocabulary for the description of conferences or events, corporate bodies, places or geographic names, differentiated persons, undifferentiated persons (name of undifferentiated persons), subject headings, and works.“
Une ontologie est composée des éléments suivants :

L’un des avantages des données liées (linked data) est que les données codées sont indépendantes de la langue. Dans l’exemple ci-dessus, l’objet représenté par le terme Butter, ou autrement dit le real world object BUTTER, est décrit en détail par des properties (propriétés). La chaîne Butter apparaît certes également dans le fichier RDF, mais seulement comme propriété de la ressource Butter :
<gndo:preferredNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Butter</gndo:preferredNameForTheSubjectHeading> Dans un cas d’application dans lequel on aurait besoin en plus du terme allemand Butter son équivalent italien, on pourrait simplement former un triple supplémentaire (le RDF est basé sur des triples), composé par exemple de la ressource http://d-nb.info/gnd/4009236-7 comme sujet, rdfs:label xml:lang=“it“ comme prédicat et du Literal (String) burro.

En partant du principe que la biblioteca nazionale Firenze procéderait de manière similaire avec son Nuovo Soggetario Thesaurus que la Deutsche Nationalbibliothek avec le GND, on pourrait mettre en relation la ressource Butter du GND avec la ressource burro idans le Nuovo Soggetario Thesaurus grâce à la propriété owl:sameAs par exemple, afin de montrer que dans les deux cas, il s’agit du même real world object BUTTER qui est décrit.
Avec la propriété <skos:broadMatch rdf:resource="http://zbw.eu/stw/descriptor/14957-0"/>, la ressource GND Butter par exemple est mise en relation avec la ressource ZWB Streichfett (fr. matières grasses à tartiner).