Alle in VerbaAlpina verwendeten zentralen Datenelemente werden an der Oberfläche mit eindeutigen IDs versehen. Diese setzen sich aus einem von der Datenkategorie abhängigem Präfix und einer Nummer zusammen. Die Nummer entspricht dabei jeweils dem Primärschlüssel des Eintrags in der entsprechenden Datenbanktabelle im Modul VA_DB.

Identifikatoren werden nicht neu vergeben. In den seltenen Fällen, in denen bestehende IDs entfernt werden (z.B. bei Duplikaten), stehen die freigewordenen Nummern nicht mehr zur Verfügung. Die Entfernung von IDs wirkt sich nur auf die jeweils aktuelle Arbeitsversion und alle folgenden Versionen aus. Ältere VA-Versionen sind davon unberührt, die Datensätze der getilgten IDs dort nach wie vor verfügbar.

Für die Präfixe der IDs gibt es folgende Möglichkeiten:

Präfix Kategorie
C Konzepte
L Morpho-lexikalische Typen
B Basistypen
A Geographische Einheiten (z. B. Gemeinden)
E Ergänzende Daten
S Tokens
G Tokengruppen (vgl. Mehrwortlexie)

Die Daten der beiden letztgenannten Kategorien unterscheiden sich strukturell nicht, da beide einen einzelnen Sprachbeleg beschreiben. Der Grund für die unterschiedlichen Präfixe ist allein dem Umstand geschuldet, dass sie in unterschiedlichen Datenbank-Tabellen geführt werden.

Im Kontext der API werden die Identifkatoren leicht abweichend verwendet: Die IDs von Tokens sowie Tokengruppen bezeichen auch dort den jeweiligen Sprachbeleg, die IDs von Konzepten, morpho-lexikalischen Typen und Gemeinden dagegen einen Datensatz, der aus allen Sprachbelegen besteht, die diesem Objekt zugeordnet sind. Die Abfrage des Konzepts C1 gibt also nicht einen Datensatz zurück, der das Konzept C1 beschreibt, sondern alle Sprachbelege, die die entsprechende Bedeutung haben.

Desweiteren werden auch alle über VerbaAlpina veröffentlichten Texte für den API-Zugriff mit eindeutigen IDs versehen. Diese teilen sich in drei Kategorien auf: Methodologische Texte (siehe Methodologie), Einträge des Lexicon Alpinum und Projektpublikationen. Die Identifikatoren haben eine abweichende Struktur, da sie zusätzlich zur eigentlichen ID im bereits beschriebenen Format eine zusätzliche Sprachangabe enthalten, die einer der Portalsprachen entspricht (vgl. Erklärungssprache). Die Sprachabkürzung ist in ISO-639-3 kodiert und wird durch einen Unterstrich getrennt angegeben.
Einträge des Lexicon Alpinums beginnen mit der ID der Entität, auf die sie sich beziehen und haben somit den Präfix C, L oder B. So beschreibt beispielsweise B5_deu den deutschsprachigen Text im Lexicon Alpinum, der den Basistyp mit der ID 5 näher beschreibt. Die beiden anderen Kategorien von Texten werden individuell nummeriert und haben die Präfixe M (Methodologie) und P (Beiträge).