In VerbaAlpina werden ausschließlich Daten verwandt, die mindestens im Gebiet einer politischen Gemeinde, wenn möglich aber noch genauer (wie z. B. Photos von Almen) georeferenziert sind. Im Blick auf die besonders wichtigen sprachlichen Daten sind zwei Typen zu unterscheiden: einerseits solche, die unmittelbar auf Äußerungen einzelner Informanten zurückgehen – wie etwa die Belege mancher, insbesondere romanischer Sprachatlanten oder auch der Bayerischen Dialektdatenbank (BayDat); diese Äußerungen werden in ihre konstitutiven Bestandteile, die so genannten Tokens zerlegt. Andererseits liefern manche Atlanten, wie etwa der SDS oder der VALTS, sowie alle Wörterbücher keine Sprecheräußerungen, sondern Formen, die von den Herausgebern bereits typisiert wurden, so dass es nicht möglich ist, bis auf die Tokens zurückzugehen.