Ob širjenju digitalnih metod se je pred kratkim pojavilo vprašanje, kako ravnati s tako imenovanimi "raziskovalnimi podatki". Zdi se, da ideje, povezane s tem, izhajajo iz pogojev v naravoslovju. Tam se pogosto zgodi, da se na primer najprej zberejo velike količine merilnih podatkov, ki se nato ovrednotijo v interpretativnih besedilih. Na prvi pogled to povzroča jasno dihotomijo, v kateri se kot "raziskovalni podatki" označujejo samo podatki o meritvah. Morda je bilo ali še vedno je običaj, da se raziskovalni podatki štejejo za minljive in jih ni vredno dolgoročno hraniti. Upravljanje raziskovalnih podatkov si je za cilj zastavilo dolgoročno ohraniti in omogočiti uporabo ne le interpretacijskih besedil, temveč tudi samih podatkov, imenovanih "raziskovalni podatki", ki so podlaga za interpretacijo.

Tema "upravljanja raziskovalnih podatkov" (FDM) se v Nemčiji trenutno (2018) močno podpira tako na zvezni kot na deželni ravni, pri čemer so se že začela izvajati številna ustrezna prizadevanja. Ustrezne dejavnosti je treba obravnavati v okviru prizadevanj za vzpostavitev Evropske odprte znanosti (EOSC) na ravni EU. Za Nemčijo je v tem okviru bil ustanovljen "Svet za informacijsko infrastrukturo" (RfII) za vzpostavitev ["nacionalne infrastrukture za raziskovalne podatke" (NFDI), Delovna skupina NFDI pri Zvezi nemških akademij (s poudarkom na humanistiki) ali pa interdisciplinarni projekt ki je bil financiran od DFG "Generic Research Data Infrastructure" (GeRDI). Projekta HeFDI ("Hesenske raziskovalne podatkovne infrastrukture") v zvezni deželi Hessen in projekt "eHumanities – interdisziplinär" , ki ga financira bavarsko ministrstvo za znanost, je potrebno omeniti kot predstavnika iniciativ FDM na državni ravni.

Z vidika humanistike je domnevno jasna ločitev med raziskovalnimi in interpretativnimi podatki ali besedili, kot je to mogoče v posameznih primerih na področju naravoslovja, izredno problematična ali vprašljiva. VerbaAlpina v tem primeru ne razlikuje, temveč šteje vse podatke, zbrane in ustvarjene v okviru projekta, za neločljivo prepleteno celoto, katere posamezni deli so med seboj povezani na različne načine. V zvezi z " upravljanjem raziskovalnih podatkov" projekt VerbaAlpina v skladu s tem izjavlja, da so vsi njeni digitalni podatki, porazdeljeni po modulih VA_DB, VA_WEB in VA_MT (tj. jezikovni podatki, komentarji, glosarji, računalniška koda, medijski podatki itd.), raziskovalni podatki, ki jih je treba ohranjati v skladu z načeli FAIR in usmeriti v ustrezna priporočila RfII (RfII 2016, Priloga A, str. A-13) je treba ohraniti. VerbaAlpina je s statusom pilotnega projekta vključena v že omenjena projekta GeRDI in "eHumanities – interdisziplinär".

Osnovni vidik upravljanja raziskovalnih podatkov je zagotavljanje interoperabilnosti v smislu, da so možne trajne povezave med projekti ali med podatkovnimi zbirkami med podskupinami zadevnih podatkovnih zbirk. Pri tem imajo pomembno vlogo tako imenovani DOIi, "Digital Object Identifier". Predstavljajo tehnični pogoj za trajno, od URL neodvisno naslovljivost "digitalnih predmetov" in jih je mogoče ustvariti za vso elektronsko vsebino, do katere je mogoče dostopati preko URL. V knjižničnem okolju so se DOIi sprva uporabljali za trajno identifikacijo elektronskih knjižnih publikacij (npr. https://doi.org/10.5282/ubm/epub.25627) ali tudi celotnih spletnih strani (npr. http://dx.doi.org.emedien.ub.uni-muenchen.de/10.5282/asica). Od te prakse odstopa potreba po interoperabilnosti med ločeno sestavljenimi in upravljanimi podatkovnimi zbirkami, ki zahteva veliko natančnejšo granulacijo. VA v ta namen ustvari vrsto datotek, ki so prek URL-jev dostopne na internetu in vsebujejo zbrano jezikovno gradivo, razvrščeno po morfoleksikalnih tipih, pojmih, izvornih občinah in posameznih zapisih. Datoteke so poimenovane z ID-ji, ki jih je dodelila VA za ustrezno kategorijo podatkov. Datoteke kategorije "občina" imajo na začetku imena datoteke črko "A", črka "C" označuje pojme, črka "L" pa morfoleksikalne tipe. Številka, ki sledi vsakemu od njih, je ID (prim. identifikatorji), ki ga je dodelila VA. Dostop do teh podatkov je mogoč prek API. Podatke DOI najprej določi univerzitetna knjižnica LMU v okviru projekta "eHumanities – interdisziplinär", ki podatke prenese tudi v svojo podatkovno zbirko, kjer bodo poglobljeno dostopni z uporabo postopkov, ki jih je treba še razviti, in ustrezne metapodatkovne sheme. Cilj je poleg tega, da so raziskovalni podatki na voljo v repozitoriju, tudi vključitev drobno zrnatih podatkov VA v knjižnične kataloge in njihovo enostavno iskanje. Podatki VA bodo iz zbirke Univerzitetne knjižnice LMU preneseni tudi v indeks projekta DFG GeRDI in tako na voljo za nadaljnjo uporabo v interdisciplinarnih kontekstih.

Od maja 2021 so podatki VerbaAlpina verzij 19/1 in 19/2 dostopni tudi v najboljši granulaciji prek raziskovalnega podatkovnega portala "Discover" od UB univerze LMU.

gl. tudi Standardni podatki