Digitalizacija v projektu VerbaAlpina ne pomeni preproste uporabe računalnikov za elektronsko obdelavo podatkov, ampak nasprotno in v bistvu digitalno globinsko obdelavo gradiva s sitematičnim in preglednim strukturiranjem in kategorizacijo.




Pri tem se uporablja skorajda izključno relacijski podatkovni model, pri katerem je podatkovno gradivo organizirano načelno v obliki preglednic. Preglednice so sestavljene iz vrstic (= zapisov, n-terčkov) in stolpcev (= atributov, polj, lastnosti), pri čemer se da vsako preglednico razširiti v vsako smer z dodatnimi vrsticami in stolpci. Med preglednicami obstajajo logične zveze, ki omogočajo smiselne povezave in ustrezne sinoptične prikaze (stike, joins) dveh ali več preglednic. Za urejanje preglednic uporablja VerbaAlpina trenutno sistem za upravljanje podatkovnih zbirk MySQL. Vendar pa preglednice niso vezane na ta sistem, ampak jih je mogoče npr. v besedilni obliki z enoumno določujočimi ločili za meje polj in podatkov (t. i. separatorji) skupaj z imeni stolpcev in dokumentacijo logičnih zvez (entitetnopovezavni model) kadar koli izvoziti. Trenutno pogosto rabljena struktura XML se na operativnem področju VerbeAlpine ne uporablja. V okviru vmesniškega koncepta pa je XML zasidran kot izvozni format.

Poleg logičnega strukturiranja podatkov igra v povezavi z digitalizacijo drugo osrednjo vlogo kodiranje jezikovnih znakov. Prav zaradi dolgoročnega arhiviranja podatkovnega gradiva je pravilno ravnanje s to tematiko zelo pomembno. VerbaAlpina se pri tem kar se da ravna po kodnih preglednicah in zahtevah konzorcija Unicode. Pri digitalizaciji jezikovnih znakov, ki doslej še niso bili sprejeti v unikodno preglednico, je posamezni znak digitalno zajet predvsem z nizanjem v obliki zaporedja znakov z unikodnega področja x21 do x7E (v območju ASCII). Ustrezne določitve pripadnosti so dokumentirane v posebnih preglednicah, s čimer je vedno možna poznejša pretvorba v unikodne vrednosti, ki bodo takrat morda na razpolago.