Seguendo la terminologia del Thesaurus Linguae Graecae (TLG), la trascrizione di sistemi di scrittura complessi con l'impiego esclusivo di caratteri ASCII viene denominata, nell'ambito di VerbaAlpina, come "codice beta". Il TLG sviluppò il concetto corrispondente all'inizio degli anni Settanta del Novecento, per il rilevamento di testi in greco antico con i mezzi digitali allora disponibili. La grafica seguente illustra la tecnica in base all'esempio dell'Atlante italo-svizzero (AIS):




Durante il trasferimento della trascrizione fonetica secondo Böhmer-Ascoli (corrisponde grosso modo a Teuthonista; un elenco con le codifiche esatte è disponibile qui), impiegata, nell'atlante linguistico, in sequenze che consistono in caratteri ASCII, viene anzitutto operata una semplice distinzione tra carattere di base e segni diacritici. Se un carattere di base è presente nel codice ASCII, questo segno rappresenterà se stesso (cosa possibile nell'esempio presentato). Subito dopo il carattere di base, seguono tutti i diacritici ad esso correlati: ogni diacritico viene sostituito da uno speciale carattere ASCII. L'attribuzione dei diacritici a caratteri ASCII è univoca all'interno di VerbaAlpina e viene documentata in tabelle speciali nel database del progetto. La scelta dell'attribuzione è guidata, per quanto possibile, dal principio della somiglianza ottica. Nell'esempio menzionato, il punto sotto la e nella parola tega viene, infatti, rappresentato da un punto interrogativo: te?. I diacritici vengono scritti seguendo l'ordine della loro disposizione rispetto al carattere di base: si scrivono nell'ordine dal basso verso l'alto, e da sinistra a destra, dopo il carattere di base. I segni diacritici vengono attribuiti a caratteri ASCII indipendentemente dalla semantica specifica della fonte corrispondente, a causa del principio della somiglianza ottica. Ciò significa che anche se un uncino sotto un carattere di base in una certa fonte presenta un significato fonetico completamente diverso rispetto ad un'altra fonte, in VerbaAlpina entrambi gli uncini verranno rappresentati da una parentesi posposta. Le differenze semantiche vengono documentate nelle tabelle di trascrizione che sono specifiche per ogni fonte: regolano la conversione del codice beta alla trascrizione output secondo IPA (una stessa codifica beta può, dunque, essere presente in codifiche IPA completamente diverse a seconda della fonte).
Il procedimento descritto è vantaggioso da diversi punti di vista:
- il rilevamento dei dati avviene sulle tastiere standard, ad una velocità comparativamente alta ed è indipendente dal sistema operativo;
- chi trascrive non ha bisogno di particolari competenze e conoscenze di sistemi di trascrizione fonetici;
- si può rilevare qualsiasi carattere o diacritico, indipendentemente dal fatto che siano cifrati in Unicode o meno;
- il rilevamento dei dati elettronico avviene senza alcuna perdita d'informazione.
Attraverso la routine di sostituzione, il codice beta può essere trasferito in quasi qualsiasi altro sistema di trascrizione.
Sull'onda di queste conversioni, si può incorrere eventualmente in una perdita d'informazioni, perdita che però è causata dalla natura dei sistemi di trascrizione stessi: la trascrizione fonetica secondo Böhmer-Ascoli, ad esempio, fa una distinzione tra i diversi gradi di apertura in modo molto più dettagliato di quanto sia previsto dal sistema IPA.