Obwohl bereits viele relevante Sprachdaten zu den Gegenstandsbereichen von VerbaAlpina vorliegen (vor allem in Atlanten und Wörterbüchern), ist es vorgesehen, neue Daten zu erheben. Damit sollen (1) Inkonsistenzen zwischen den bereits vorliegenden Quellen ausgeglichen, (2) Lücken bzw. Ungenauigkeiten beseitigt und (3) überkommene Bezeichnungen bzw. Geräte als solche gekennzeichnet werden. Die Neuerhebungen werden aber nicht mit den klassischen Verfahren der Feldforschung durchgeführt, sondern mit den Mitteln, die uns die sozialen Medien inzwischen zur Verfügung stellen. Entsprechende Verfahren werden oft unter dem Ausdruck crowdsourcing zusammengefasst.
„Crowdsourcing ist eine interaktive Form der Leistungserbringung, die kollaborativ oder wettbewerbsorientiert organisiert ist und eine große Anzahl extrinsisch oder intrinsisch motivierter Akteure unterschiedlichen Wissensstands unter Verwendung moderner IuK-Systeme auf Basis des Web 2.0 einbezieht." (Martin/Lessmann/Voß 2008).
Die Referenz auf die crowd ist in mancher Hinsicht missverständlich, nicht zuletzt deshalb, weil damit für viele Beliebigkeit, Laienhaftigkeit und mangelnder Verlässlichkeit assoziiert sind; die Bedenken sind insofern nicht ganz ungerechtfertigt, als sich entsprechende Verfahren in der Tat an eine unbestimmte und anonyme Menge potentieller Interessenten wenden. Grundsätzliche Probleme ergeben sich sowohl auf der Seite des wissenschaftlichen Projektanbieters wie auf der Seite des Projektadressaten (der ein Laie sein kann, aber nicht sein muss): Das Angebot muss hinreichend 'sichtbar' und attraktiv sein und der Adressat muss hinreichend sprach- und sachkompetent sein. Es gibt unterschiedliche Strategien, damit umzugehen. So kann man versuchen, die Attraktivität des Angebots in seiner Unterhaltsamkeit zu verankern und spielartige Oberflächen entwerfen, wie es etwa im Projektverbund play4science versucht wurde; nach den dort gemachten Erfahrungen erscheint es jedoch aussichtsreicher, den Informanten, d.h. hier den Sprechern, zu vermitteln, dass sie der Forschung ganz direkt mit ihrem persönlichen Sprach- und Sachwissen weiterhelfen (vgl. die Liste der citizen science-Projekte). Die Kompetenz lässt sich über gezielte Wissensabfragen einschätzen, aber es ist zweifellos verlässlicher, sich die gelieferten Daten durch andere Sprecher desselben Orte bestätigen und validieren zu lassen. Ein erfolgreiches Pilotprojekt zum geolinguistischen Einsatz von crowdsourcing ist der Atlas zur deutschen Alltagssprache (AdA) von Stephan Elspaß und Robert Möller; er markiert einen Meilenstein auf dem Weg in die digitale Geolinguistik.
In VerbaAlpina geht es konkret darum, Daten aus gedruckten Quellen wie vor allem Sprachatlanten und Wörterbüchern zu transkribieren und strukturiert in einer Datenbank zu erfassen, vorhandene Transkriptionen auf Korrektheit zu überprüfen oder auch bereits transkribiertes Material zu typisieren und lexikalischen Lemmata zuzuordnen. Willkommen sind auch Kommentare, z. B. zu Herkunft und Verbreitung von Wörtern bzw. Worttypen. Sehr interessiert ist VerbaAlpina darüber hinaus an aktuellem Sprachmaterial, das nicht in publizierten Quellen wie den genannten Sprachatlanten und Wörterbüchern dokumentiert ist. Wer immer also Kenntnisse eines im Alpenraum gesprochenen Dialekts hat, ist eingeladen, spezielle Ausdrücke dieses Dialekts in den Datenbestand von VerbaAlpina einzutragen. Auf diese Weise wird es möglich, den in den gedruckten Quellen überlieferten Datenbestand zunächst anzureichern und in der Folge z. B. dynamische Prozesse des Sprachwandels zu erkennen und zu beobachten. Das funktioniert umso besser, je mehr Personen sich am Projekt in dieser Weise beteiligen. – Außerdem sind Bilder von alpentypischen Objekten, aber auch von Almen, Hütten, Flora, Fauna, Bergen und Landschaftsformen mitsamt ihren Bezeichnungen willkommen. Sie können in der Mediathek gespeichert werden.
Parallel zur gezielten Mitarbeit bei VerbaAlpina erhält jeder Nutzer die Möglichkeit, sich in unserem System eine eigene Forschungsumgebung einzurichten, die für die Sammlung von hauptsächlich Sprachdaten, jedoch durchaus auch von anderen Daten verwendet werden kann. Voraussetzung ist lediglich, dass diese georeferenziebar sind. Er hat die Möglichkeit, diese Daten gleichsam ausschließlich für die persönliche Verwendung unter Verschluss zu halten oder aber den Zugriff anderen Nutzern freizugeben, um sie zur Diskussion zu stellen und kommentieren zu lassen. Nur wenn möglichst viele Daten der Allgemeinheit zur Verfügung gestellt werden, kann sich das Potenzial der datenbank- und netzwerkgestützten Technologien voll entfalten.
VerbaAlpina dokumentiert die Vitalität des Crowdsourcing-Tools auf einer speziellen Übersichtsseite. Die Erfahrungen des nunmehr seit über zwei Jahren währenden Einsatzes des Crowdsourcing-Tools von VerbaAlpina haben gezeigt, dass der erfolgreiche Einsatz eines solchen Werkzeugs generell und ganz entscheidend von flankierenden Publicity-Maßnahmen abhängt. Die Aktivitäten der Crowd steigen jedesmal an, wenn das VA-Crowdsourcing in der Öffentlichkeit thematisiert worden ist.
Neben dem in der WordPress-Umgebung von VerbaAlpina entwickelten Crowdsourcing-Modul nutzt VerbaAlpina auch die Plattform von Zooniverse, einem sog. Citizen Science Portal, zur Einbindung von Freiwilligen im Internet, die für VerbaAlpina bestimmte Aufgaben erledigen sollen. Das von VerbaAlpina entwickelte Zooniverse-Tool ist unter der Adresse https://www.zooniverse.org/projects/filip-hr/verbaalpina/classify erreichbar. Die ursprüngliche Idee war gewesen, den von Zooniverse kostenfrei zur Verfügung gestellten Software-"Baukasten" zur Entwicklung eines Crowdsourcing-Tools zu nutzen und sich auf diese Weise eine arbeits- und zeitintensive Eigenentwicklung zu sparen. Eine zusätzliche Motivation bestand in der Hoffnung, von der bestehenden großen Freiwilligen-Community von Zooniverse profitieren zu können, um an möglichst zahlreiche "Crowder" heranzukommen und so einen quantitativ großen Effekt zu erzielen.
Zunächst war geplant gewesen, die Crowder Transkriptionen von Eintragungen auf Karten in Sprachatlanten, in einer ersten Phase des AIS, anfertigen zu lassen. Im Lauf der Entwicklungsarbeit, die überwiegend von Filip Hristov geleistet wurde, hat sich jedoch herausgestellt, dass die anfänglichen Erwartungen an Zooniverse in mehrfacher Hinsicht nicht erfüllt wurden. So gestaltete sich allein schon die Nutzung des Zooniverse-Software-Baukastens als deutlich komplizierter, als dies erwartet worden war. Hinzu kam das Mitspracherecht von Zooniverse-Moderatoren, die mehrfach auf Änderungen von Konzept und Realisierung drängten, bevor das Tool schließlich, am 31.03.2021, als offizielles Zooniverse-Projekt an den Start gehen konnte.
Bereits in der Entwicklungsphase kamen Bedenken auf, ob die im Detail doch recht komplizierte Transkription der Eintragungen speziell des AIS von Laien würden geleistet werden können. Dies führte zu dem Entschluss, die Aufgabe der "Crowder" zu modifizieren. Die Transkription der Atlasdaten wurde zu einer optionalen Leistung herabgestuft. Im Vordergrund stand dagegen schließlich die manuell leichte Zuordnung der schriftlich auf den Atlaskarten eingetragenen Sprachbelege zu den, ebenfalls auf der Karte eingetragenen Nummern der Erhebungspunkte, die jeweils für den Informanten stehen, von dem die entsprechende Äußerung stammt. Die "Crowder" werden aufgefordert, Text auf der online-Karte mit einem Rechteck zu umgeben und dieses Rechteck sodann der richtigen Informantennummer zuzuordnen. Die Koordinaten der Rechtecke werden am Ende in die Datenbank von VerbaAlpina übernommen. Durch sie ist es möglich, die entsprechenden Bildinhalte automatisch aus dem Kartenbild auszuschneiden und anschließend an ein OCR-Programm zu übergeben.



