splošno o GND

Indeksiranje knjižnične vsebine v osnovi temelji na dveh stebrih:
V letu 2012 so bile v GND združene prejšnje standardne datoteke PND (Personennamendatei = normativna datoteka osebnih imen), GKD (Gemeinsame Körperschaftsdatei = normativna datoteka korporativnih imen), SWD (Schlagwortnormdatei = normativna datoteka predmetnih oznak) in EST (Einheitssachtitel des Deutschen Musikarchivs = zbirka naslovov nemškega glasbenega arhiva). Tako je bilo opuščeno prejšnje ločevanje na standardne podatke za formalno indeksiranje in standardne podatke za predmetno indeksiranje. Danes je na voljo en podatkovni niz na entiteto, ki se lahko uporablja v obeh kontekstih.

O razvoju in praksi podeljevanja

Hkrati DNB (= nemška narodna knjižnica) preizkuša postopke, s katerimi se lahko ključne besede dodelijo avtomatično.

O GND v okviru normalizacije in izmenjave podatkov

Knjižnice so si že zelo zgodaj začele med seboj izmenjevati podatke o indeksiranju. Za to sta potrebna enoten (izmenjevalni) format (MARC) in besednjak (GND), ki standardizira poimenovanja in hkrati rešuje problem sinonimov, homonimov itd. Že nekaj let se podatki ne izmenjujejo le med knjižnicami, temveč tudi med različnimi kulturnimi ustanovami in institucijami znanja. Pri tem GND kot vir podatkov o standardih vse pogosteje uporabljajo tudi arhivi, muzeji itd.; s tem je postal zelo pomemben za digital humanities. (Prim. projekt GND4C: https://www.dnb.de/DE/Professionell/ProjekteKooperationen/Projekte/GND4C/gnd4c.html)
Uporaba standardnih podatkov, zlasti GND, agregatorjem podatkov, kot je Nemška digitalna knjižnica ali bavarikon, omogoča povezovanje objektov iz različnih sektorjev in s tem izboljšanje njihove najdljivosti.
Prednost od GND v tem kontekstu lahko prikažemo z (namišljenim) primerom:
V bavarikonu je na primer portret Martina Luthra in hkrati kovanec s podobo Martina Luthra. Oba predmeta imata za "predmet" Martina Luthra, vendar ju lahko sistem (na preprost način) poveže le, če v obeh primerih v polje dc:subject ni vnesen le niz (string), temveč tudi enolični identifikator, kot je GND-ID (118575449). Če se namesto identifikatorja uporabijo nize, je povsem mogoče, da se med seboj razlikujejo, tj. v teh primerih bi bila mišljena ista oseba, vendar bi se njeni identifikatorji razlikovali. Pogled na stolpec "Druga imena" v zbirki podatkov GND jasno pokaže, da to sploh ni malo verjetno:
http://d-nb.info/gnd/118575449. Človeku ni težko združiti (nekoliko) različnih nizov, za računalnik pa je to večja ovira.

O GND v kontekstu povezanih podatkov (Linked Data)

Čeprav se GND zdaj vse pogosteje uporablja tudi zunaj knjižnic, je oblika zapisov GND, MARC, izrazito domensko specifična in se zunaj knjižničnega sveta ne uporablja. GND Ontologija predstavlja poskus zapolnitve te pomanjkljivosti, da bi bil GND uporaben tudi za uporabo v semantičnem spletu (Semantic Web), saj:

„The need for name disambiguation and entries having an authoritative character is an issue that concerns a lot more communities than the library world. In a growing information society the unique identification and linking of persons, places and other authorities becomes more and more important. The GND Ontology aims to transfer the made experience from libraries to the web community by providing a vocabulary for the description of conferences or events, corporate bodies, places or geographic names, differentiated persons, undifferentiated persons (name of undifferentiated persons), subject headings, and works.“
Ontologija je sestavljena iz sledečih komponent:

Ena od prednosti povezanih podatkov (LinkedData) je, da so kodirane informacije neodvisne od jezika. V zgornjem primeru je predmet, ki ga predstavlja izraz Butter, ali z drugimi besedami real world object BUTTER, podrobneje opisan z lastnostmi. Niz (string) Butter se prav tako pojavi v datoteki RDF, vendar le kot Property od vira Butter:
<gndo:preferredNameForTheSubjectHeading rdf:datatype="http://www.w3.org/2001/XMLSchema#string">Butter</gndo:preferredNameForTheSubjectHeading> V primeru uporabe, ko bi poleg nemškega izraza Butter potrebovali tudi italijanski ekvivalent nemškega izraza butter, bi lahko za to preprosto oblikovali drugo trojico (RDF temelji na trojicah), npr. sestavljeno iz vira http://d-nb.info/gnd/4009236-7 kot subjekt, rdfs:label xml:lang="it" kot predikat in dobesednega (LIteral) (niza) burro.

Ob domnevi, da bi Biblioteca nazionale Firenze s svojim tezavrom Nuovo Soggetario Thesaurus ravnala podobno kot DNB z GND, bi lahko vir Butter v GND povezali z virom burro v tezavru Nuovo Soggetario, npr. prek lastnosti owl:sameAs, da bi izrazili, da je v obeh primerih opisan isti real world object BUTTER.
Z Property <skos:broadMatch rdf:resource="http://zbw.eu/stw/descriptor/14957-0"/> je na primer vir GND Butter povezan z virom ZBW Streichfett.