Tous les éléments de données centraux de Verba Alpina sont pourvus en surface d’un ID sans équivoque. Ceux-ci sont composés d’un préfixe indépendant de la catégorie de données et d’un numéro. Le numéro correspond respectivement à une clé primaire de l’entrée dans le tableau de la base de données correspondant dans le module VA_DB.
Les identificateurs ne sont pas réattribués. Dans les rares cas où des ID sont supprimés (par exemple lors de doublons), les numéros ainsi libérés ne sont plus disponibles. La suppression d’ID affecte seulement la version de travail actuelle et toutes les versions suivantes. Les versions VA précédentes sont préservées et les jeux de données des ID effacés y restent disponibles.
Pour les préfixes des ID, il existe les possibilités suivantes :
| Préfixe |
Catégorie |
| C |
Concepts |
| L |
Types morpho-lexicaux |
| B |
Types de base |
| A |
Unités géographiques (par exemple, les communes) |
| E |
Données complémentaires |
| S |
Tokens |
| G |
Tokengruppen (vgl. Lexie plurilexicale) |
Les données des deux dernières catégories citées sont structurellement identiques, puisque tous deux décrivent une seule attestation linguistique. La seule raison pour les préfixes différents est le fait qu’ils figurent dans des tableaux de bases de données différents.
Dans le contexte de l’API, les identificateurs sont utilisés de manière légèrement différente : les ID des tokens et des groupes de tokens y désignent également l'attestation linguistique respective, en revanche les ID des concepts, des types morpho-lexicaux et des communes désignent un ensemble de données composé de toutes les attestations linguistiques qui sont rattachées à cet objet. La recherche du concept C1 ne renvoie pas un jeu de données qui décrit le concept C1, mais toutes les attestations linguistiques dont la signification correspond.
En outre, tous les textes publiés sur Verba Alpina sont pourvus d’ID sans équivoques pour l’accès à l’API. Ceux-ci se divisent en trois catégories : les textes méthodologiques (voir Methodologie), les entrées du Lexicon Alpinum et les Projektpublikationen. Les identificateurs ont une structure différente, puisqu’ils comportent en plus de l’ID véritable dans le format déjà décrit une spécification linguistique supplémentaire, qui correspond à l’une des langues du portal (cf. Langue d'explication). L’abréviation de la langue est codée dans le ISO-639-3 et est donnée séparément à l’aide d’un sous-tiret. Les entrées du Lexicon Alpinum commencent par l’ID de l’entité à laquelle elles se rapportent et ont ainsi le préfixe C, L ou B. Ainsi, B5_deu définit par exemple le texte en allemand dans le Lexicon Alpinum, qui décrit le type basique avec l’ID 5. Les deux autres catégories de textes sont numérotées individuellement et ont les préfixes M (méthodologie) et P (contributions).Identifikationsnummer
VerbaAlpina
Datenbank
vergleiche