Izraz STANDARDNI PODATKI izvira iz knjižničarstva. Pri katalogizaciji publikacij je npr. nujno, da je mogoče nedvoumno identificirati avtorje, da bi lahko dela nedvoumno pripisali ustreznemu avtorju, ne glede na različne zapise ali spremembe imena. Enaka potreba se pojavlja tudi pri indeksiranju zapisane literature, na primer zato, da bi lahko jasno opredelili geografske izraze, ki so predmet različnih obravnav, in jih nato tudi med seboj povezali. Te potrebe so privedle do oblikovanja ustreznih onomazioloških seznamov, ki so jih sprva vodile posamezne knjižnice.

Zaradi možnosti tehničnega povezovanja podatkovnih zbirk, katerega začetki segajo v 1970-ta leta, je bilo kmalu treba uskladiti imenike, ki so jih prej vodile posamezne knjižnice. Zato so knjižnice najkasneje v osemdesetih letih prejšnjega stoletja – začetni načrti so nastali že konec sedemdesetih let – začele usklajevati posamezne imenike ter oblikovati skupne imenike oseb in predmetnih gesel, da bi dosegle usklajenost med knjižnicami. Sčasoma so bili sprva ustvarjeni tematsko ločeni imeniki: Indeks oseb (Personennamendatei, PND=normativna datoteka osebnih imen), indeks pravnih oseb (Körperschaftsdatei, GKD=normativna datoteka korporativnih imen) in indeks predmetnih rubrik (Schlagwortnormdatei, SWD=normativna datoteka predmetnih oznak). Nazadnje je bilo jasno, da nastala tematska ločitev ni ustrezna, zlasti ker osebe in korporacije ne morejo biti le avtorji ali založniki, temveč tudi predmet publikacij, zato jih je treba ustrezno upoštevati tudi pri indeksiranju na podlagi standardne datoteke s predmetnimi naslovi. Zaradi tega so bile tri ločene standardne datoteke (vključno z enotno datoteko naslovov nemškega glasbenega arhiva) med letoma 2009 in 2012 združene v skupni projekt Nemške nacionalne knjižnice in nemškojezičnih knjižničnih povezav v tako imenovano skupno standardno datoteko (GND). Ta je javnosti na voljo od leta 2012, medtem pa v različnih formatih (MARC 21 Authority, MARC21-xml in RDFxml), in se vse pogosteje uporablja za indeksiranje zunaj knjižničnega področja. Tako se na primer standardne podatke uporablja v DH-projektih , ki potekajo v ITG BMLO. (Bavarska glasbena enciklopedija na spletu) in Kaiserhof ter se jih uporablja za nedvomno identifikacijo oseb.

Pod naslovom http://ognd.bsz-bw.de/ (storitev Centra za knjižnične storitve Baden-Württemberg) je na voljo priročno iskalno orodje za iskanje po GND. Standardne datoteke, primerljive z GND, hranijo ustanove, predvsem knjižnice, po vsem svetu. Od leta 2003 DNB in Kongresna knjižnica sodelujeta pri projektu VIAF (Virtual International Authority File), katere cilj je združiti te zbirke podatkov v en sam sistem in omogočiti dostop do njih.

Čeprav sistem standardnih podatkov omogoča nedvoumno identifikacijo oseb in konceptov zgolj v teoretičnem smislu, je njegova konkretna uporabnost odvisna od tehnične izvedbe v elektronskih knjižničnih katalogih. V katalogih DNB in Bayerische Staatsbibliothek (BSB), iskanje "Homère" vrne tudi rezultate, katerih bibliografski zapis vsebuje le nemški zapis "Homer". Po drugi strani pa se v spletnem katalogu BSB ob kliku na ime avtorja s povezavo pod njim trenutno (november 2018) še vedno izpišejo naslovi, ki niso samo delo ustreznega posameznika, ampak tudi delo avtorjev z istim imenom.

Čeprav je izvor koncepta standardnih podatkov očitno iz področja knjižničarstva, se je uporaba standardnih podatkov medtem uveljavila tudi na drugih področjih. Kot primer lahko navedemo projekte Geonames (entiteta Geographica), Pleiades ( entiteta antična Geographica) ali tudi Glottolog (entiteta svetovni jeziki).

Standardni podatki so zelo pomembni za interoperabilnost, ki jo med drugim zahteva iniciativa FAIR. Z definicijo standardnega datuma in dodelitvijo (alfa)numeričnega identifikatorja obstaja tudi možnost logičnega in tehničnega združevanja sorodnih podatkov v ločenih podatkovnih nizih, poleg vključitve v indeksiranje vsebine knjižničnih arhivov.

Z vidika VerbaAlpina bi bila vzpostavitev kategorij standardnih podatkov " morfoleksikalni tip" (⇒ tipizacija) in "koncept" metodološko konsistentna in zato zelo zaželena. To bi omogočilo, da se morfoleksikalnim tipom in konceptom dodelijo identifikatorji. Na ta način je mogoče leksikalne podatke nedvoumno povezati med seboj na svetovni ravni, v primeru pojmov pa tudi neodvisno od posameznega jezika. Pristope v tej smeri je mogoče opaziti le občasno. V strukturiranih podatkovnih zbirkah projekta Wikidata so na primer dodeljeni tako imenovani Q-ID, ki edinstveno opredeljujejo izvenjezikovne pojme in tako zagotavljajo skupno in enako referenco za različne članke v različnih jezikovnih verzijah Wikipedije o isti temi. Koncept ALMHÜTTE je na Wikidata enolično identificiran, npr. s Q-ID Q2649726. Ustrezni vnos v Wikidata se nanaša na sorodne članke na Wikipediji v trenutno (oktober 2018) skupaj sedmih različnih jezikih. Od trenutno (oktober 2018) skupno 2629 konceptov, ki jih je zabeležila VerbaAlpina, jih je bilo do zdaj natančno 400 dodeljenih z oznako Q-ID. Identifikatorji Q-ID, če so na voljo, so vpisani v podatkovno zbirko VerbaAlpina. Podobna sistematična opredelitev morfoleksikalnih tipov v okviru Wikipedije ali projekta Wikidata še ne obstaja. Za jezikovna poimenovanja so bili doslej dodeljeni le osnovni L-ID; vendar ni jasno, ali so s tem mišljeni natančno določeni tipi.

VerbaAlpina na podlagi modela standardnih podatkovnih ID-jev dodeljuje lastne identifikatorje za podatkovne kategorije (entitete) "koncept", "morfoleksični tip" (glej tipizacija) in "občina", ki jih je mogoče s preprostim preslikavanjem povezati z drugimi že vzpostavljenimi standardnimi podatkovnimi sistemi, kot so Q-ID-ji projekta Wikidata. VerbaAlpina si prizadeva tudi za vključitev podatkovne kategorije " morfoleksikalni tip" v sistematiko Gemeinsame Normdatei (GND)(=mednarodna normativna datoteka). Ustrezna perspektiva obstaja, zlasti ker je treba GND vsebinsko in strukturalno razširiti in prilagoditi potrebam znanosti ter splošnih kulturnih ustanov in oseb. Konferenca GNDCon 2018, načrtovana za december 2018, naj bi omogočila ustrezno izmenjavo. Tam bodo interese VerbaAlpine zastopali člani Münchenske univerzitetne knjižnice in ITG.

GND trenutno razlikuje naslednje entitete: korporacija (sigla: b), konferenca (f), geografija/krajevno ime (g), oseba (neindividualizirana) (n), oseba (individualizirana) (p), predmetna oznaka (s) in delo (u) (https://wiki.dnb.de/download/attachments/90411323/entitaetenSatztypen.pdf). Iz dokumenta DNB iz kategorije "pomočnik mednarodne normativne datoteke (GND)" je razvidno, da je za kategorijo "črke, morfemi, besede kot predmet jezikoslovnega raziskovanja" navedena posebna oznaka entitete "slz" kot podkategorija entitete "Sachbegriff" (predmetna oznaka). Zdi se očitno, da je treba standardne podatke projekta VerbaAlpina povezati s to kategorijo.

Literatura:
Capellaro 2003