Au sein de VerbaAlpina sont utilisées exclusivement des données géoréférenciées au moins sur le territoire d'une commune, et si possible encore plus précisément (par exemple des photos d'alpages). À l'égard de données linguistiques particulièrement importantes, deux types sont à distinguer : d'un côté, les données remontant directement aux énoncés des informateurs individuels – comme par exemple les attestations de certains atlas linguistiques (spécialement les atlas romans) ou de la Bayerische Dialektdatenbank (BayDat); ces énoncés sont décomposés selon leurs éléments constitutifs, les tokens. De l'autre, des formes déjà typisées par les éditeurs – en effet certains atlas, par exemple le SDS, le VALTS ainsi que les dictionnaires, ne contiennent pas d'énoncés de locuteur, de sorte qu'il n'est pas possible de remonter jusqu'aux tokens.