VerbaAlpina réunit des données issues de différents types de sources : des données d'atlas linguistiques et de dictionnaires imprimés, qui doivent tout d'abord être numérisées, ainsi que des données déjà numérisées, issues de projets partenaires. Chaque source utilise des systèmes de transcription plus ou moins individuels. Pour réaliser l'uniformisation nécessaire, des listes sont établies dans lesquelles il est fixé quel caractère du système de transcription d'une source X correspond à quel autre dans le système de transcription d'une source Y. Il s'agit surtout de retranscrire les différents systèmes de transcription en Alphabet phonétique international (API), qui fait office de transcription de référence dans VerbaAlpina. Pour convertir le système de transcription spécifique à une source en système API, on doit créer une liste complète sous forme de tableau indiquant les correspondances de caractère. Un tel tableau est nommé "page de code". Ci-dessous un extrait de la page de code fondamentale pour la conversion du système de transcription de l'AIS en API. Cette page de code comprend environ 4500 lignes/affectations en tout :


La colonne `BETA` comprend les caractères utilisés dans l'AIS en forme transcrite selon le principe du beta code; la colonne `IPA` le caractère API correspondant, et la colonne `HEX` la valeur ou les valeurs du tableau Unicode qui correspond(ent) au caractère API.

Un aperçu complet des pages de code de toutes les sources de VerbaAlpina se trouve ici.