La sempre più repentina diffusione dei metodi digitali ha fatto emergere la questione del trattamento dei cosiddetti “dati di ricerca”. Sembra che le idee ad esso connesse facciano riferimento alle relazioni presenti nelle diverse discipline naturali. All'interno di queste ultime, infatti, lo scenario spesso profilato prevede che un'enorme mole di dati venga in primo luogo raccolta e successivamente interpretata in testi esplicativi. Da quest'idea risulta una chiara suddivisione, nella quale solo i dati di misurazione possono essere considerati come ''dati di ricerca''. È possibile che finora sia stata, o sia ancora, consuetudine considerare i dati di ricerca come poco rilevanti e che, per questo motivo, si sia creduto e si creda che essi non vadano conservati a tempo indeterminato. L'obiettivo della gestione dei dati di ricerca, tuttavia, non è quello di conservare a lungo termine solamente i testi interpretativi, bensì anche i ''dati di ricerca'' alla base della loro interpretazione, oltre che di renderli riutilizzabili.

Il tema della ''gestione dei dati di ricerca'' (FDM) è, ad oggi (2018), fortemente promosso in Germania sia a livello federale che a livello dei singoli Länder, attraverso una serie di progetti di rilievo. Le attività ad esso relative sono state avviate in considerazione della volontà di istituire un cosiddetto European Open Science Cloud (EOSC) a livello europeo. In Germania, il “Rat für Informationsinfrastrukturen" (ita. Consiglio per le infrastrutture dell'informazione scientifica) ha proposto, ad esempio, le seguenti misure a livello interregionale e nazionale: la creazione di un'"Infrastruttura nazionale dei dati di ricerca" (NFDI), l'istituzione del gruppo di lavoro NFDI dell'Unione accademica [NFDI Working Group of the Academic Union | https://www.akademienunion.de/arbeitsgruppen/ehumanities/nfdi-arbeitsgruppe/]] (con particolare attenzione alle scienze umane); e ancora, a partire dal 2016, il progetto interdisciplinare "Generic Research Data Infrastructure" , finanziato dal DFG (GeRDI), i progetti HeFDI ("Hessische Forschungsdateninfrastrukturen”; ita. Infrastrutture di ricerca dell’Assia) ed infine il progetto ["eHumanities – interdisziplinär" | https://www.fdm-bayern.org/]], finanziato dal Ministero della Scienza bavarese.

La presunta chiara distinzione tra ricerca ed interpretazione di dati o testi, resa possibile, in alcuni validi casi isolati, per le scienze naturali, è, invece, estremamente problematica e discutibile nell'ambito delle scienze umane. In ogni caso, VerbaAlpina non opera una distinzione in questo senso, ma considera tutti i dati raccolti e generati attraverso il progetto come un insieme inscindibilmente intrecciato, le cui singole parti sono tra loro collegate attraverso diversi legami. Ai sensi della ''gestione dei dati di ricerca'', VerbaAlpina dichiara la totalità dei suoi dati digitali distribuiti tra i moduli VA_DB, VA_WEB e VA_MT (ovvero dati linguistici, commenti, voci di glossario, codici informatici e file media ecc.) come dati di ricerca, secondo i principi FAIR e si orienta alle raccomandazioni del RfII (RfII 2016, allegato A, p. A-13). VerbaAlpina possiede lo status di progetto pilota ed è coinvolto nei sopracitati progetti GeRDI e “eHumanities – interdisziplinär”.

Un aspetto essenziale della gestione dei dati della ricerca è la garanzia di interoperabilità, in quanto sono possibili collegamenti permanenti tra parti di progetti o database. In questo senso, anche i cosiddetti DOIs, i "Digital Object Identifiers", giocano un ruolo importante. Questi rappresentano il prerequisito tecnico per l'indirizzabilità permanente ed indipendente dall'URL degli "oggetti digitali", e possono essere generati per tutti i contenuti elettronici accessibili tramite un URL. In ambito bibliotecario, i DOI sono stati inizialmente utilizzati per l'identificazione persistente di pubblicazioni elettroniche di libri (ad es. https://doi.org/10.5282/ubm/epub.25627) o di interi siti web (ad es. http://dx.doi.org.emedien.ub.uni-muenchen.de/10.5282/asica). A differenza di questa pratica, la necessità di interoperabilità tra dati sviluppati e gestiti separatamente richiede una gestione molto più ricercata. A questo scopo, VA genera una serie di file accessibili su Internet tramite URL, i quali contengono il materiale linguistico raccolto, raggruppato per tipologie morfo-lessicali, concetti, comunità di origine e singoli documenti. I file sono contraddistinti attraverso gli ID delle rispettive categorie di dati assegnati da VA. I file della categoria "Comuni" sono indicati da una "A" all'inizio del nome del file, "C" indica i concetti e "L", invece, i tipi morfo-lessicali. I numeri ID sono assegnati in maniera automatica da VA e l'accesso a questi dati è possibile tramite l'indirizzo https://www.verba-alpina.gwi.uni-muenchen.de/export.


L'assegnazione dei DOI viene inizialmente effettuata nell'ambito del progetto "eHumanities – interdisziplinär" dalla Biblioteca Universitaria della LMU, il quale rileva, tra l'altro, i dati nella propria banca dati e, attraverso procedimenti ancora da sviluppare e attraverso l'utilizzo di uno schema di meta-dati adatto, li rende al suo interno ancora più accessibili.

Si veda anche Controllo di autorità.