Tutti gli elementi di dati centrali utilizzati in VerbaAlpina sono dotati di ID univoci sulla superficie. Questi sono costituiti da un prefisso dipendente dalla categoria di dati e da un numero. Il numero corrisponde alla chiave primaria della voce nella corrispondente tabella del database nel Modulo VA_DB.
Gli identificatori non vengono riassegnati. Nei rari casi in cui vengono rimossi ID esistenti (ad es. in caso di duplicati), i numeri liberati non sono più disponibili. La rimozione degli ID riguarda solo la versione di lavoro corrente e tutte le versioni successive. Le versioni VA precedenti non sono interessate, vale a dire che i record di dati degli ID cancellati sono ancora disponibili lì.
Per i prefissi degli ID ci sono le seguenti opzioni:
prefisso
categoria
C
concetti
L
tipi morfo-lessicali
B
tipi di base
A
entità geografiche (p. es. comuni)
E
dati complementari
S
token
G
gruppi di token (cfr. Polirematiche)
I dati delle ultime due categorie non si distinguono strutturalmente, poiché entrambi descrivono un singolo record di lingua. Il motivo dei diversi prefissi è unicamente dovuto al fatto che sono gestiti in diverse tabelle del database.
Nel contesto dell'API, gli identificatori sono usati in modo leggermente diverso: Gli ID dei token e dei gruppi di token designano anche lì il rispettivo documento linguistico, mentre gli ID dei concetti, dei tipi morfo-lessicali e delle comunità designano un set di dati che consiste di tutti i documenti linguistici assegnati a questo oggetto.
Quindi, la query del concetto C1 non restituisce un record che descrive il concetto C1, ma tutte le prove linguistiche che hanno il significato adeguato.
Inoltre, tutti i testi pubblicati tramite VerbaAlpina sono dotati di ID univoci per l'accesso API. Questi sono divisi in tre categorie: testi metodologici (cfr. Methodologie), voci di Lexicon Alpinum e Projektpublikationen. Gli identificatori hanno una struttura diversa perché, oltre all'ID vero e proprio, contengono anche un'ulteriore specifica della lingua nel formato già descritto, che corrisponde a una delle lingue del portale (cfr. Lingua). L'abbreviazione della lingua è codificata in ISO-639-3 ed è specificata separata da un carattere di sottolineatura.
Le voci nel Lexicon Alpinum iniziano con l'ID dell'entità a cui si riferiscono e sono quindi precedute da C, L o B. Ad esempio, B5_deu descrive il testo in lingua tedesca nel Lexicon Alpinum, che descrive in modo più dettagliato il tipo di base con ID 5. Le altre due categorie di testi sono numerate singolarmente e hanno i prefissi M (metodologia) e P (contributi).