Dump der MySQL-Datenbank VerbaAlpina, Version 232 (= zweite Jahreshälfte 2023)
Kontaktdaten:
Prof. Dr. Thomas Krefeld
Ludwig-Maximilians-Universität München
Institut für Romanische Philologie
Geschwister-Scholl-PLatz 1
80539 München
thomas.krefeld@lmu.de
Dr. phil. Stephan Lücke
Ludwig-Maximilians-Universität München
IT-Gruppe Geisteswissenschaften
Geschwister-Scholl-PLatz 1
80539 München
Tel. 089 2180 6401
luecke@lmu.de
Die Datenbank entstand im Rahmen des von der DFG von 2014 bis 2023 geförderten Langfristvorhabens "
VerbaAlpina".
Sie enthält im Wesentlichen die strukturierten sprachwissenschaftlichen
Kerndaten des Projekts. Die operative Version der Datenbank fungiert
als Backend des unter
https://dx.doi.org/10.5282/verba-alpina (=
https://www.verba-alpina.gwi.uni-muenchen.de/) erreichbaren Projektportals.
Der hier abgelegte Dump enthält ausschließlich Daten, die der
Öffentlichkeit unter der CC BY-SA 4.0 Lizenz zugänglich gemacht werden
können. Die Original-Projektdatenbank enthält darüberhinaus weitere
nicht-öffentliche projektinterne Daten, die Aufschluss über den
Projektverlauf geben. Die Original-Projektdatenbank wird bis auf
weiteres an der IT-Gruppe Geisteswissenschaften der
LMU aufbewahrt und gewartet.
Die Datenbank lief zuletzt operativ auf folgender Server-Version:
5.7.44-48-57-log – Percona XtraDB Cluster (GPL), Release rel48, Revision
32be3bd, WSREP version 31.65, wsrep_31.65
Der hier vorliegende Dump der Datenbank gehört zu den folgenden, eng auf
einander bezogenen Datenpaketen, die im Zuge des
Forschungsdatenmanagements auf Open Data
LMU abgelegt wurden:
1. Krefeld, Thomas und Lücke, Stephan: VerbaAlpina Version 23/2:
Diskursive Inhalte: Beiträge des Moduls "Methodologie". 31. Oktober
2023. Open Data
LMU. 10.5282/ubm/data.464
2. Krefeld, Thomas und Lücke, Stephan: VerbaAlpina Version 23/2:
Diskursive Inhalte: Eigenständige Artikel, die auf der
WordPress-Webschnittstelle von VerbaAlpina veröffentlicht worden sind.
31. Oktober 2023. Open Data
LMU. 10.5282/ubm/data.465
3. Krefeld, Thomas und Lücke, Stephan: VerbaAlpina Version 23/2:
Diskursive Inhalte: Kommentare des LexiconAlpinum zu definierten
Basistypen (Vorläufern morpholexikalischer Typen). 31. Oktober 2023.
Open Data
LMU. 10.5282/ubm/data.461
4. Krefeld, Thomas und Lücke, Stephan: VerbaAlpina Version 23/2:
Diskursive Inhalte: Kommentare des LexiconAlpinum zu definierten
Konzepten. 31. Oktober 2023. Open Data
LMU. 10.5282/ubm/data.462
5. Krefeld, Thomas und Lücke, Stephan: VerbaAlpina Version 23/2:
Diskursive Inhalte: Kommentare des LexiconAlpinum zu definierten
morpholexikalischen Typen. 31. Oktober 2023. Open Data
LMU. 10.5282/ubm/data.463
6. Krefeld, Thomas und Lücke, Stephan: VerbaAlpina Version 23/2:
Mediendateien mit lizenzrechtlicher Nutzungsbeschränkung. 31. Oktober
2023. Open Data
LMU. 10.5282/ubm/data.467 Der Zugang zum Datensatz ist beschränkt.
7. Krefeld, Thomas und Lücke, Stephan: VerbaAlpina Version 23/2:
Mediendateien ohne lizenzrechtliche Nutzungsbeschränkung. 31. Oktober
2023. Open Data
LMU. 10.5282/ubm/data.466
Unter der Adresse
https://www.verba-alpina.gwi.uni-muenchen.de/?page_id=12368
findet sich eine detaillierte Dokumentation der vollständigen
Datenbank. Im folgenden wird ein Ausschnitt dieser Dokumentation für die
im Dump enthaltenen Tabellen wiedergegeben. Verweise auf Tabellen, die
nicht enthalten sind, sind
rot hinterlegt.
Ludwig-Maximilians-Universität München
Tabelle aeusserungen
BeschreibungDiese
Tabelle enthält unbearbeitete Sprachbelege, die in die
VerbaAlpina-Datenbank eingefügt werden. Die hauptsächlichen Quellen sind
dabei das
Transkriptionstool, das
Crowdsourcing-Tool und aus den Partnerdatenbanken importierte Belege (
vgl. Kooperation).
Die Belege werden im Zuge der Tokenisierung verarbeitet und in die Tabellen
`Tokens` und
`Tokengruppen` übertragen, die dann als Grundlage für die Publikation dienen.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_aeusserung | int(10) unsigned | beliebig | Eindeutige ID. |
id_stimulus | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `stimuli` verweist. Stimulus, durch den dieser Beleg produziert wurde. |
id_informant | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `informanten` verweist. Informant, von dem dieser Beleg stammt. |
aeusserung | varchar(500) | beliebig | Die
eigentliche Äußerung. Die Kodierung ist abhängig von der jeweiligen
Quelle, die über den Stimulus bzw. den Informanten festgelegt wird.
Diese Spalte kann außer einer transkribierten Äußerung auch einen
speziellen Wert in spitzen Klammern enthalten. Die folgende Tabelle
erklärt diese Sonderfälle:
Wert |
Erklärung |
<vacat> |
Bedeutet, dass die jeweilige Quelle für diese
Informant-Stimulus-Kombination keinen Beleg angibt und dient zur
Markierung, welche Belege bereits bearbeitet wurden. In den weiteren
Verarbeitungsschritten werden diese Einträge ignoriert.
|
<problem> |
Mit dieser Markierung können im Transkriptionstool
Belege versehen werden, die (aktuell) nicht transkribiert werden
können. Dies kann verschiedene Gründe haben, z.B. Zeichen oder
Transkriptionskonventionen, die durch die aktuelle Version des Betacodes nicht abgedeckt werden. Die Problemfälle können nachträglich gesammelt nachbearbeitet werden. |
<Bezeichnung nicht bekannt> |
Markiert, dass dem Informanten für dieses Konzept keine Bezeichnung bekannt ist.
|
<Konzept nicht vorhanden> |
Markiert, dass der Informant dieses Konzept nicht kennt.
|
Dieses Feld kann mehrere Belege in einer Zeile enhalten, falls ein
Informant mehrere Belege geliefert hat. Diese werden entweder durch ein
Semikolon (verschiedene Worttypen) oder ein Komma (nur grammatikalische
Variation, z.B. Numerus) getrennt. |
bemerkung | varchar(5000) | beliebig | Freitextfeld für Bemerkungen.
Bei Belegen, die über das Crowdsourcing-Tool
eingegeben werden, wird in diesem Feld auch die originale Nutzereingabe
angegeben, falls die Äußerung strukturell nicht den Anforderungen
entspricht. Dies ist hauptsächlich bei falschen Trennzeichen oder
abkürzenden Schreibweisen der Fall (siehe die folgenden Beispiele).
Korrigierte Äußerung | Bemerkung |
hocka, Hackl | Nutzereingabe: "hocka oder Hackl" |
Milch siibä, Milch siänä | Nutzereingabe: "Milch siibä / siänä" |
|
erfasst_von | varchar(50) | beliebig | Nutzername der Person, die diese Äußerung eingegeben/importiert hat. |
erfasst_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
version | tinyint(4) unsigned | 1 | Aufsteigende
Nummer um redundante Mehrfachtranskriptionen zum Auffinden von Fehlern
zu ermöglichen. Dies wird aktuell nicht verwendet; das Feld enthält
somit immer den Wert 1. |
klassifizierung | enum | 'B','P','M' | Jede
Äußerung ist entweder ein Einzelbeleg (B), d.h. eine direkte
phonetische Transkription der Sprecheräußerung, oder bereits von der
Quelle vortypisiert. Je nachdem welche Eigenschaften der verschiedenen
Äußerungen eines Stimulus noch unterscheidbar ist, werden solche Belege
als phonetischer Typ (P) oder morpho-lexikalischer Typ (M) markiert. Die
Einteilung ist in vielen Fällen rein quellenabhängig, muss aber bei
gewissen Quellen nach Einzelfall bei der Transkription entschieden werden. |
tokenisiert | tinyint(1) | beliebig | Gibt an, ob diese Äußerung bereits tokenisiert ist. Dieses Flag ist nicht zwingend notwendig, da sein Wert aus der Tabelle `Tokens` abgeleitet werden kann, es dient lediglich zur Optimierung. |
gesperrt | tinyint(1) | beliebig | Nur relevant für Belege, die über das Crowdsourcing-Tool
eingegeben werden. Solange eine Äußerung nicht gesperrt ist, kann der
jeweilige Nutzer sie noch im Tool abändern. Die Sperrung wird als
Vorstufe zur Tokenisierung verwendet und erlaubt keine weiteren
Änderungen. |
portalsprache | varchar(10) | 'deu', 'ita', 'fra', 'slv' | Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Gibt die Sprache an, die jeweilige Nutzer im Tool gewählt hat. Diese entspricht nicht der Sprache der Äußerung, sondern nur der der Oberfläche (Bedienelemente, Hinweise, etc.) |
id_dialekt | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `dialects` verweist. Nur relevant für Belege, die über das Crowdsourcing-Tool
eingegeben werden. Gibt den im Tool ausgewählten Dialekt an. Da diese
Möglichkeit in älteren Versionen des Tools noch nicht gegeben war, gibt
es auch Crowdsourcing-Äußerungen, bei denen dieses Feld leer ist. |
ignoriert | tinyint(1) | beliebig | Nur relevant für Belege, die über das Crowdsourcing-Tool
eingegeben werden. Dieses Flag dient der Markierung von Äußerungen, die
offensichtlich absichtliche Falschangaben sind oder so formatiert sind,
dass sie technisch nicht verarbeitet werden können. Diese werden bei
der Tokensierung (aktuell) nicht berücksichtigt. |
geaendert_am | timestamp | beliebig | Zeitpunkt der letzten Änderung |
verifiziert_am | timestamp | beliebig | Temporäres Feld zur Verfikation der Tokensierung von älteren Belegen. Gibt den Zeitpunkt der Verifikation an. |
nicht_verifizieren | tinyint(1) | beliebig | Temporäres Feld zur Verfikation der Tokensierung von älteren Belegen. Gibt an, dass diese Äußerung übersprungen werden soll. |
vergleiche
Identifikationsnummer
Tabelle basistypen
BeschreibungListet die von VerbaAlpina verwendeten Basistypen (
vgl. Typisierung).
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_basistyp | int(10) unsigned | beliebig | Eindeutige ID des Basistyps. An der Oberfläche werden diese IDs mit dem Präfix "B" verwendet (vgl. Identifikatoren). |
orth | varchar(200) | beliebig | Textuelle Repräsentation des Basistyps. |
alpenwort | tinyint(1) | beliebig | Gibt an, ob dieser Basistyp nur in den Alpen gebräuchlich ist. |
quelle | varchar(50) | 'VA' | Fremdschlüssel, der auf die Tabelle `bibliographie`
verweist. Dieses Feld ist prinzipiell dafür vorgesehen alternative
Typisierungen voneinander zu unterscheiden. Aktuell ist aber nur die von
VerbaAlpina angelegten Basistypen vorhanden. |
sprache | varchar(5) | beliebig | Fremdschlüssel, der auf die Tabelle `sprachen` verweist. Gibt die Sprache des Basistyps an. |
angelegt_von | varchar(50) | beliebig | Wordpress-
Nutzername der Person, die diesen Basistyp angelegt hat. Bei älteren,
manuell in der Datenbank erstellten Einträgen nicht konsequent
ausgefüllt. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
kommentar_intern | text | beliebig | Freitextfeld für einen internen Kommentar, der nicht an der Oberfläche auftaucht. |
vergleiche
Identifikationsnummer
VerbaAlpina
Tabelle bedeutungen
BeschreibungIn
dieser Tabelle werden (sprachabhängige) Bedeutungen gelistet, wie sie
in der entsprechenden Quelle angegeben werden. Sie wird nur für
Massenimporte von Daten aus Partnerprojekten verwendet, bei denen noch
keine Zuordnung zu den von
VA verwendeten
`Konzepten` vorhanden ist. An der Oberfläche wird die Bedeutung anstelle eine Konzepts verwendet, solange dieses fehlt.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_bedeutung | int(10) unsigned | beliebig | Eindeutige ID. |
sprache | enum | beliebig | Fremdschlüssel, der auf die Tabelle `sprachen` verweist. |
bedeutung | varchar(500) | beliebig | Die textuelle Repräsentation der Bedeutung in der angegebenen Sprache. |
id_konzept | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte` verweist. |
VerbaAlpina
Identifikationsnummer
Tabelle bibliographie
BeschreibungDiese
Tabelle enthält alle von VerbaAlpina verwendeten Quellen. Das schließt
Sprachatlanten, Wörterbücher, Datenbanken, etc. ein, aus denen direkt
Sprachbelege importiert/transkribiert werden, Lexika, die als Referenz
für die
VA-eigenen Typen verwendet werden, aber auch weitere Quellen, die in Textbeiträgen referenziert werden.
Zusätzlich sind die folgenden "Pseudo-Einträge" vorhanden:
- VA: Wird für immer dann verwendet, wenn ein Datum im Projekt selbst erzeugt wurde, besipielweise für von VA angelegte Typisierungen.
- CROWD: Wird für Belege verwendet, die über das Crowdsourcing-Tool erhoben werden.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
abkuerzung | varchar(50) | beliebig | Gibt
eine eindeutige Abkürzung für den Eintrag an. Für normale
bibliographische Quellen sollten entweder etablierte Abkürzungen (AIS, SDS, etc.) verwendet werden oder das Format <Autor> <Jahr>. |
basiserfassung | varchar(1000) | beliebig | Kann
verwendet werden, um schnell neue Einträge anzulegen, indem die
vollständige bibliographische Information temporär hier angegeben wird.
Längerfristig sollten alle Angaben in die entsprechenden Felder (Autor,
Titel, etc.) eingegeben werden. |
kategorie | enum | '','A','W' | Markiert Atlanten (A) und Wörterbücher (W). |
autor | varchar(500) | beliebig | Autoren bzw. Herausgeber im Format <Nachname1>, <Vorname1> / <Nachname2>, <Vorname2>, ...
Herausgeber sollten mit nachstelltem "(Hrsg.)" bzw. "(Hrsgg.)" markiert werden. |
titel | varchar(1000) | beliebig | Titel des Werks, der Homepage etc. |
ort | varchar(100) | beliebig | Erscheinungsort |
jahr | varchar(50) | beliebig | Erscheingsjahr |
band | varchar(10) | beliebig | Bandnummer bei mehrbändigen Werken, Zeitschriften etc. |
enthalten_in | varchar(300) | beliebig | Gibt (falls anwendbar) die Zeitschrift / den Sammelband etc. an, in dem der Eintrag enthalten ist. |
seiten | varchar(50) | beliebig | Gibt (falls anwendbar) die Seitenzahlen innerhalb des unter "Enthalten_In" gegebenen Werks an. |
verlag | varchar(100) | beliebig | Verlag der Publikation |
sprache | char(3) | beliebig | Fremdschlüssel, der auf die Tabelle `sprachen` verweist. Gibt die Sprache an, in der das Werk verfasst wurde, NICHT die Sprache(n), die in ihm behandelt werden. |
download_url | varchar(250) | beliebig | Download-Link (falls vorhanden) |
download_datum | date | beliebig | Datum des Downloads (falls anwendbar) |
kontaktadresse | varchar(200) | beliebig | Gibt (falls anwendbar) eine Kontaktadresse an. |
va_erfassung | enum | '0','1' | Gibt
an, ob aus diesem Werk direkt Sprachbelege für VerbaAlpina erfasst
werden (1) oder nicht (0). Dies ist hauptsächlich für Sprachatlanten,
Wörterbücher und Sprachdatenbanken relevant. |
va_publikation | enum | '0','1' | Gibt an, ob das Werk von VerbaAlpina publiziert wurde. |
referenzwoerterbuch | tinyint(1) | beliebig | Gibt an, ob das Werk als Referenzwörterbuch für morpho-lexikalische Typen verwendet wird (vgl. `lemmata`). |
bemerkung | varchar(1000) | beliebig | Freitextfeld für zusätzliche Kommentare. |
schlagwoerter | varchar(1000) | beliebig | Kann
(unstrukturiert) Schlagwörter enthalten und zum leichteren Auffinden
bestimmter Einträge dienen. Dient nur dem internen Gebrauch und wird an
der Oberfäche nicht verwendet. |
ausgeliehen_von | varchar(100) | beliebig | Gibt für aktuell geliehene Bibliotheksbücher die Person an, die das Buch entliehen hat. |
rueckgabefrist | date | beliebig | Gibt für aktuell geliehene Bibliotheksbücher die Rückgabefrist an. |
oeffentlich | tinyint(1) | beliebig | Gibt an, ob der Eintrag öffentlich (d.h. unter Bibliographie) erscheinen soll. |
abschlussarbeit | tinyint(1) | beliebig | Gibt an, ob der Eintrag eine Abschlussarbeit ist (1) oder nicht (0). |
va_ipa | tinyint(1) | beliebig | Nur relevant für Einträge, die als "VA_Erfassung" markiert sind. Gibt an, ob für die entsprechenden Belege aus der Quellentranskription von VerbaAlpina eine IPA-Darstellung geniert wird (s. Codepage). |
va_beta | tinyint(1) | beliebig | Nur relevant für Einträge, die als "VA_Erfassung" markiert sind. Gibt an, ob die entsprechenden Belege im Betacode von VerbaAlpina kodiert sind. Das ist hauptsächlich für Belege der Fall, die von VerbaAlpina über das Transkriptionstool
eingegeben werden. Zum Teil werden aber auch Belege, die nur in
speziellen Schriftarten dargestellt werden können vor dem Import in
Betacode umgewandelt. |
referenz_basistyp | tinyint(1) | beliebig | Gibt an, ob das Werk als Referenzwörterbuch für Basistypen verwendet wird (vgl. `lemmata_basistypen`). |
ist_abkuerzung | tinyint(1) | beliebig | Markiert
Einträge, die im Feld "Abkuerzung" eine spezielle Abkürzung enthalten
und nicht im Format <Autor> <Jahr> sind. |
publikation_datum | date | beliebig | Datum
der Publikation. Wird nur für die Sortierung der VerbaAlpina-eigenen
Publikationen verwendet und ist für die meisten Zeilen nicht gesetzt. |
link_paywall | tinyint(1) | beliebig | Markiert
Publikationen im Rahmen von VerbaAlpina, die extern veröffentlicht
wurden und sich hinter einer Paywall befinden, um im Frontend einen
entsprechenden Hinweis anzeigen zu können. |
VerbaAlpina
Sprachatlas der deutschen Schweiz
vergleiche
International Phonetic Alphabet
siehe
Tabelle codepage_ipa
BeschreibungEnthält eine Übersetzung von Betacode-Zeichen in
IPA-
Zeichen, die abhängig von der jeweiligen Quelle ist, d.h. das selbe
Betacode-Zeichen kann für unterschiedliche Quellen in unterschiedliche
IPA-Zeichen übersetzt werden (
vgl. Codepage). Eine Übersicht für die verschiedenen Quellen findet sich hier:
Übersicht Codepages. Der Betacode kann hierbei sowohl
der von VerbaAlpina verwendete als auch eine andere quellenspezifische Transkription sein.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
erhebung | varchar(20) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie` verweist. Gibt an für welche Quelle diese Übersezung gültig ist. |
beta | varchar(50) | beliebig | Der
Buchstabe im Betacode. In den meisten Fällen werden Buchstaben aus
mehreren Zeichen zusammengesetzt, die ein Basiszeichen und Diakritika
angeben. |
ipa | varchar(50) | beliebig | Unicode-Darstellung des entsprechenden IPA-Zeichens. |
hex_ipa | varchar(50) | beliebig | Hexadezimal-Darstellung des unter "IPA" angegeben Unicode-Zeichens. |
art | enum | 'Zeichen','Akzent','Trennzeichen','Vokal' | Markiert verschiedene Zeichentypen:
- Zeichen: Standardkategorie für Buchstaben
- Akzent: Markiert Akzent-Zeichen. Akzente werden immer
einzeln angegeben, d.h. die Buchstaben unter der Kategorie "Zeichen"
enthalten keine Akzentzeichen.
- Trennzeichen: Gibt Zeichen an, die zwei Wörter trennen.
Zusätzlich zu Leerzeichen werden hier auch die Betacode-Darstellungen
von z.B. Bindebögen angegeben.
- Vokal: Markiert Vokale ohne Diakritika. Vokale mit Diakritika werden als "Zeichen" markiert.
Diese Klassifizierungen werden für die IPA-Konversions-Routine bzw. die Tokenisierung benötigt. |
kommentar_intern | varchar(250) | beliebig | Freitextfeld für zusätzliche Angaben zur Übersetzung dieses Zeichens. |
International Phonetic Alphabet
vergleiche
Tabelle codepage_original
BeschreibungEnthält eine Übersetzung der
VA-Betacode-Zeichen (
vgl. Betacode)
in eine entsprechende Unicode-Darstellung. In Fällen, in denen das
Zeichen nicht / nicht vollständig in Unicode kodiert werden kann, sind
zusätzliche HTML-Tags vorhanden. Im Gegensatz zur Tabelle
`codepage_ipa`
sind die hier gelisteten Übersetzungen quellenunabhängig, da nicht die
phonetische Information einer bestimmten Transkription, sondern einzig
die typographische Darstellung eines Zeichens relevant ist.
Die Daten in dieser Tabelle ermöglichen zusätzlich zur
IPA-Darstellung (
vgl. Codepage) eine Darstellung der Belege in der quelleneigenen Transkription.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
beta | varchar(50) | beliebig | Der
Buchstabe im Betacode. In den meisten Fällen werden Buchstaben aus
mehreren Zeichen zusammengesetzt, die ein Basiszeichen und Diakritika
angeben. |
original | varchar(2000) | beliebig | Unicode- bzw. HTML-Datestellung des entsprechenden Zeichens. |
hex_original | varchar(2000) | beliebig | Hexadezimal-Darstellung der unter "Original" angegeben Unicode-Zeichen. |
VerbaAlpina
vergleiche
International Phonetic Alphabet
Tabelle dialects
BeschreibungListe von Dialekten, die im
Crowdsourcing-Tool den eingetragenen Belegen zugeordnet werden können.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_dialect | int(10) unsigned | beliebig | Eindeutige ID. |
name | varchar(100) | beliebig | Bezeichnung des Dialekts. |
sprachfamilie | enum | 'rom','ger','sla','' | Angabe einer Sprachfamilie. |
bemerkung | varchar(200) | beliebig | Feld für Zusatzangaben. |
Identifikationsnummer
Tabelle glossar
BeschreibungEnthält die Texte, die auf der VerbaAlpina Homepage unter
Methodologie geführt werden, in den verschiedenen Oberflächensprachen (
vgl. Erklärungssprache). Die Felder für eine ladinische Übersetzung wurden vorgesehen, sind allerdings aktuell nicht befüllt.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_eintrag | int(11) unsigned | beliebig | Eindeutige ID des Eintrags. An der Oberfläche werden diese IDs mit dem Präfix "M" verwendet (vgl. Identifikatoren). |
terminus_d | varchar(100) | beliebig | Deutscher Titel des Methodologie-Eintrags. |
erlaeuterung_d | text | beliebig | Deutscher Text des Methodologie-Eintrags. |
terminus_i | varchar(100) | beliebig | Italienischer Titel des Methodologie-Eintrags. |
erlaeuterung_i | text | beliebig | Italienischer Text des Methodologie-Eintrags. |
terminus_f | varchar(100) | beliebig | Französischer Titel des Methodologie-Eintrags. |
erlaeuterung_f | text | beliebig | Französischer Text des Methodologie-Eintrags. |
terminus_r | varchar(100) | beliebig | Titel des Methodologie-Eintrags in Rumantsch Grischun. |
erlaeuterung_r | text | beliebig | Text des Methodologie-Eintrags in Rumantsch Grischun. |
terminus_s | varchar(100) | beliebig | Slowenischer Titel des Methodologie-Eintrags. |
erlaeuterung_s | text | beliebig | Slowenischer Text des Methodologie-Eintrags. |
terminus_e | varchar(100) | beliebig | Englischer Titel des Methodologie-Eintrags. |
erlaeuterung_e | text | beliebig | Englischer Text des Methodologie-Eintrags. |
kategorie | enum | 'Methodologie','Sonder' | Kategorie des Eintrags:
- Methodologie = Regulärer Methodologie-Eintrag
- Sonder = Sonstiger Textbeitrag, der weder in der Methodlogie noch im Lexicon Alpinum gelistet wird. Dies wird für die Projektbeschreibung auf der Startseite, die Beschreibung der einzelnen Versionen und verschiedene Präambel-Texte genutzt.
|
intern | enum | '0','1' | Gibt an, ob der Eintrag projektintern (0) oder öffentlich ist (1). |
terminus_l | varchar(100) | beliebig | Ladinischer Titel des Methodologie-Eintrags (aktuell nicht verwendet). |
erlaeuterung_l | text | beliebig | Ladinischer Text des Methodologie-Eintrags (aktuell nicht verwendet). |
fertig | tinyint(1) | beliebig | Gibt
an, ob der Eintrag (in seiner ersten Fassung und in der unter
Originalsprache gelisteten Sprache) fertiggestellt wurde und damit
öffentlich angezeigt und versioniert wird. |
angelegt_d | char(3) | beliebig | Versionsnummer der Version, in der die deutsche Version dieses Eintrag erstmalig veröffentlicht wurde (ohne das Zeichen "/") |
geaendert_d | char(3) | beliebig | Versionsnummer der Version, in der die deutsche Version dieses Eintrag zum letzten Mal verändert wurde (ohne das Zeichen "/") |
angelegt_f | char(3) | beliebig | Versionsnummer der Version, in der die französische Version dieses Eintrag erstmalig veröffentlicht wurde (ohne das Zeichen "/") |
geaendert_f | char(3) | beliebig | Versionsnummer der Version, in der die französische Version dieses Eintrag zum letzten Mal verändert wurde (ohne das Zeichen "/") |
angelegt_i | char(3) | beliebig | Versionsnummer der Version, in der die italienische Version dieses Eintrag erstmalig veröffentlicht wurde (ohne das Zeichen "/") |
geaendert_i | char(3) | beliebig | Versionsnummer der Version, in der die italienische Version dieses Eintrag zum letzten Mal verändert wurde (ohne das Zeichen "/") |
angelegt_r | char(3) | beliebig | Versionsnummer der Version, in der die Rumantsch Grischun Version dieses Eintrag erstmalig veröffentlicht wurde (ohne das Zeichen "/") |
geaendert_r | char(3) | beliebig | Versionsnummer der Version, in der die Rumantsch Grischun Version dieses Eintrag zum letzten Mal verändert wurde (ohne das Zeichen "/") |
angelegt_s | char(3) | beliebig | Versionsnummer der Version, in der die slowenische Version dieses Eintrag erstmalig veröffentlicht wurde (ohne das Zeichen "/") |
geaendert_s | char(3) | beliebig | Versionsnummer der Version, in der die slowenische Version dieses Eintrag zum letzten Mal verändert wurde (ohne das Zeichen "/") |
angelegt_e | char(3) | beliebig | Versionsnummer der Version, in der die englische Version dieses Eintrag erstmalig veröffentlicht wurde (ohne das Zeichen "/") |
geaendert_e | char(3) | beliebig | Versionsnummer der Version, in der die englische Version dieses Eintrag zum letzten Mal verändert wurde (ohne das Zeichen "/") |
originalsprache | char(1) | beliebig | Sprache, in der dieser Eintrag verfasst wurde. |
qid | int(10) unsigned | beliebig | QID eines entsprechenden Eintrags in Wikidata (Der Präfix "Q" ist nicht enthalten). |
vergleiche
Identifikationsnummer
BeschreibungDiese Tabelle wird vom
Karten-Plugin von VerbaAlpina erzeugt und zum Teil um Spalten erweitert. Sie enthält die Einträge des
Lexicon Alpinums, die dort und auf der
interaktiven Karte angezeigt werden. Im Gegensatz zu den Einträgen in der Tabelle
`Glossar` gibt es für jede Sprachversion einen eigenen Eintrag.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id | varchar(20) | beliebig | Eindeutige ID des Lexicon Alpinum Eintrags. An der Oberfläche werden diese IDs mit dem Präfix "L" verwendet (vgl. Identifikatoren). |
source | varchar(50) | beliebig | Enthält die die Quelle des Eintrags. Grundsätzlich für alternative Kommentare vorgesehen, aktuell ist dort nur der Wert "VA" vorhanden. |
author | varchar(100) | beliebig | Wordpress-
Nutzername der Person, die diesen Text erstellt hat. Nur für die
Sprachversion angegeben, in der dieser Text erstellt wurde. |
created | timestamp | beliebig | Zeitpunkt der Erstellung |
changed | timestamp | beliebig | Zeitpunkt der letzten Änderung |
language | char(2) | beliebig | Sprache des Eintrags in ISO 639-1-Kodierung. |
comment | text | beliebig | Textinhalt des Eintrags. |
locked | timestamp | beliebig | Dieses Flag wird gesetzt, wenn dieser Eintrag aktuell bearbeitet wird. |
internal | tinyint(1) | beliebig | Gibt an, ob der Eintrag projektintern (0) oder öffentlich ist (1). |
approved | enum | '','S','T','TS' | Spalte für den internen Korrekturprozess. |
Identifikationsnummer
vergleiche
VerbaAlpina
Beschreibung
Diese
Tabelle enthält Informationen zur Person, von der ein Sprachbelegt
stammt. Je nach Quelle kann es vorkommen, dass ausschließlich
geographische Information vorhanden ist.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_informant | int(10) unsigned | beliebig | Eindeutige ID. |
id_gemeinde | int(10) unsigned | beliebig | Gemeinde, in der die Georeferenzierung dieses Informanten liegt. Fremdschlüssel, der auf die Tabelle `orte` verweist. |
erhebung | varchar(20) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie`
verweist. Quelle, aus der dieser Informant übernommen wurde. Für
Belege, die von VerbaAlpina selbst erhoben wurden, wird der Wert "Crowd"
verwendet. |
nummer | varchar(100) | beliebig | Nummer des Informanten in der jeweiligen Quelle. Für Belege aus dem Crowdsourcing-Tool
wird bei Registrierung der Wordpress-Login-Name, ansonsten ein
aufsteigend nummerierter Wert nach dem Muster "anonymousCrowder_x"
verwendet. |
sprache | enum | '','ger','rom','sla','gersla','romger','romsla','romgersla' | Zuordnung des Informanten zu einem der Sprachgebiete auf der interaktiven Karte. |
alter_informant | varchar(30) | beliebig | Alter des Informanten (falls bekannt) |
geschlecht | enum | '','m','w' | Geschlecht des Informanten (falls bekannt) |
sachaufnahmen | enum | '','0','1','2' | Nur für Belege aus dem AIS
relevant. Gibt an, ob dieser Informant keine (0), ausschließlich (1)
oder zusätzlich (2) Sachaufnahmen geliefert hat, also keine
Sorachbelege, sondern beispielsweise Zeichnungen von Konzepten o.ä. |
analphabet | tinyint(1) | beliebig | Nur für Belege aus dem AIS relevant. Gibt an, ob der Informant Analphabet ist. |
minderheit | enum | '','Bündnerromanisch','Dolomitenladinisch','Friaulisch' | Nur für Belege aus dem AIS relevant. Gibt an eine eventuelle Minderheitssprache des Informanten an. |
ortsname | varchar(100) | beliebig | Name
des Orts bzw. Ortsteils, in dem der Informant zum Zeitpunkt der
Erhebung gelebt hat. Dies entspricht in manchen Fällen (z.B. auch bei
allen Belegen aus dem Crowdsourcing-Tool) auch dem Namen der adminstrativen Gemeinde. Die eigentliche Gruppierung der Informanten nach Gemeinden auf der interaktiven Karte findet aber über den Wert in "Id_Gemeinde" statt. |
bemerkungen | varchar(500) | beliebig | Feld für Bemerkungen, die aus der Quelle übernommen wurden oder interne Notizen. |
georeferenz | pointDieser
Datentyp speichert geometrische Daten in MySQL-Datenbanken. Die
einfachste Möglichkeit diese manuell einzutragen, ist die Verwendung der
GeomFromText-Funktion. Diese erlaubt die Eingabe der Daten im WKT-Format. Alle
geographischen Koordinaten in VerbaAlpina werden in der Reihenfolge
<Längengrad>, <Breitengrad> angegeben. Die Eingabe eines
Punktes mit den Koordinaten Breitengrad 48.135876 und Längengrad
11.583720 könnte somit folgendermaßen über die phpMyAdmin-Oberfläche angegeben werden: | beliebig | Georefernzierung des Informanten |
alpenkonvention | tinyint(1) | beliebig | Dieser Wert gibt an, ob sich der Eintrag innerhalb der Alpenkonvention befindet (1) oder nicht (0). Kann mit dem Befehl
ST_WITHIN(Geodaten, (SELECT Geodaten FROM Orte WHERE Id_Kategorie = 1))
berechnet werden. |
position | int(10) | beliebig | Feld um die quellenspezifische Nummerierung der Informanten abzubilden. |
id_ak_gemeinde | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `gemeinden_ak` verweist. |
Bibliographie
- AIS = Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, Zofingen, vol. 1-7
Jaberg, Karl / Jud, Jakob (1928-1940): Sprach- und Sachatlas Italiens und der Südschweiz, Zofingen, vol. 1-7
Identifikationsnummer
oder ähnliche/s
Tabelle konzepte
BeschreibungDiese Tabelle listet die Konzepte, die den jeweiligen Sprachbelegen als Bedeutungsbeschreibung zugeordnet sind (
vgl. Konzept). Alle Konzepte wurden projektintern manuell angelegt, basieren aber in vielen Fällen auf den im Quellenmaterial angegeben
`Stimuli`.
In jeder Sprache ist primär die Konzeptbeschreibung ausschlaggebend,
die eher technisch gehalten ist. Ein zusätzlicher Name wird nur
angegeben, wenn es in der jeweiligen Sprache einen eindeutigen Begriff
gibt, der dieses Konzept klar beschreibt. Falls möglich, werden die
Konzepte außerdem mit der jeweiligen Entsprechung in der
Wissensdatenbank
Wikidata verknüpft.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_konzept | int(11) unsigned | beliebig | Eindeutige ID des Konzepts. An der Oberfläche werden diese IDs mit dem Präfix "C" verwendet (vgl. Identifikatoren). |
name_d | varchar(100) | beliebig | Eindeutiger deutscher Begriff für dieses Konzept (falls vorhanden) |
beschreibung_d | varchar(500) | beliebig | Deutsche Beschreibung des Konzepts (ist für jedes Konzept vorhanden) |
name_i | varchar(100) | beliebig | Eindeutiger italienischer Begriff für dieses Konzept (falls vorhanden) |
beschreibung_i | varchar(500) | beliebig | Italienische Beschreibung des Konzepts |
name_f | varchar(100) | beliebig | Eindeutiger französischer Begriff für dieses Konzept (falls vorhanden) |
beschreibung_f | varchar(500) | beliebig | Französische Beschreibung des Konzepts |
name_r | varchar(100) | beliebig | Eindeutiger Begriff in Rumantsch_Grischun für dieses Konzept (falls vorhanden) |
beschreibung_r | varchar(500) | beliebig | Beschreibung des Konzepts in Rumantsch_Grischun |
name_s | varchar(100) | beliebig | Eindeutiger slowenischer Begriff für dieses Konzept (falls vorhanden) |
beschreibung_s | varchar(500) | beliebig | Slowenische Beschreibung des Konzepts |
name_e | varchar(100) | beliebig | Eindeutiger englischer Begriff für dieses Konzept (falls vorhanden) |
beschreibung_e | varchar(500) | beliebig | Englische Beschreibung des Konzepts |
korrigiert | tinyint(1) | beliebig | Temporäres Feld zur Hilfe bei Korrekturen. |
taxonomie | varchar(500) | beliebig | Bezeichnung in der biologischen Taxonomie (falls anwendbar) |
kommentar_intern | text | beliebig | Feld für interne Notizen |
relevanz | tinyint(1) | beliebig | Gibt an, ob das Konzept einer der drei Projektdomänen (vgl. Onomasiologischer Rahmen, Projektbeschreibung) zugeordnet werden kann |
pseudo | tinyint(1) | beliebig | Gibt
an, dass dieser Eintrag kein eigentliches Konzept beschreibt, sondern
aus technischen Gründen exisitiert. Zum Beispiel gibt es den Eintag
"(PROBLEM)", mit dem Belege verknüpft werden können, bei denen die
Konzeptzuordnung unklar ist. |
grammatikalisch | tinyint(1) | beliebig | Diese
Markierung gibt an, dass hier kein eigentliches Konzept vorliegt,
sonden eine grammatikalische Kategorie. Hiermit werden Tokens verknüpft,
die eine rein grammatikalische Funktion haben (Artikel, Präpositionen
etc.) und nicht einem eigentlichen Konzept zugeordnet werden können.
Grundsätzlich werden solche Daten nicht erfasst, zum Teil treten sie
aber als Bestandteil einer Mehrwortlexie auf. An der Oberfläche erscheinen die Tokens, die mit einem "grammatikalischen Konzept" verbunden sind, nicht. |
name_l | varchar(100) | beliebig | Eindeutiger ladinischer Begriff für dieses Konzept (falls vorhanden) (nicht verwendet) |
beschreibung_l | varchar(500) | beliebig | Ladinische Beschreibung des Konzepts (nicht verwendet) |
angelegt_von | varchar(50) | beliebig | Wordpress-
Nutzername der Person, die dieses Konzept angelegt hat. Bei älteren,
manuell in der Datenbank erstellten Einträgen nicht konsequent
ausgefüllt. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
basiskonzept | tinyint(1) | beliebig | Mit diesem Marker können Konzepte markiert werden, die besonders relevant sind und im Crowdsourcing-Tool an erster Stelle stehen und gesondert ausgezeichnet werden. |
vorschlag | tinyint(1) | beliebig | Soll Konzepte markieren, die von Nutzenden des Crowdsourcing-Tools vorgeschlagen wurde, ist aber nicht konsequent verwendet |
va_phase | enum | '','1','2','3','4' | Gibt
an, in welcher Projektphase das Konzept angelegt wurde. Ist nicht
konsequent gesetzt und wurde nur für projektinterne Prozesse verwendet. |
qid | int(10) unsigned | beliebig | Gibt die ID in der Wikidata-Datenbank (https://www.wikidata.org/) an, die diesem Konzept entspricht (Der Präfix "Q" ist nicht enthalten). |
gnd | varchar(15) | beliebig | Gibt eine entsprechende ID in der Gemeinsamen Normdatei an. |
id_kategorie | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte_kategorien` verweist. |
cs_beschreibung | tinyint(1) | beliebig | Intern verwendetes Feld |
qid_oldid | int(10) unsigned | beliebig | Gibt eine Revisions-ID
zur Wikidata-QID an. Beide zusammen können einen Link der Form
https://www.wikidata.org/w/index.php?
title=<QID>&oldid=<QID_oldid> gebildet werden, der auf
den Stand des Wikidata-Eintrags zum Zeitpunkt der Eintragung der QID in
die Datenbank verweist. |
vergleiche
Identifikationsnummer
Tabelle konzepte_kategorien
BeschreibungEnthält Kategorien, nach den die Einträge in der Tabelle
`Konzepte` gruppiert werden. Dies wird für die hierarchische Konzeptauswahl auf der
interaktiven Karte verwendet.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_kategorie | int(10) unsigned | beliebig | Eindeutige ID. |
kategorie | varchar(100) | beliebig | Deutsche Bezeichnung der Kategorie |
id_ueberkategorie | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte_kategorien` verweist und die ID einer eventuelle Überkategorie enthält. |
Identifikationsnummer
Tabelle lemmata
BeschreibungDiese Tabelle speichert Lemmata aus verschiedenen Wörterbüchern, die von VerbaAlpina als Referenzwörterbücher für
morpho-lexikalische Typen
verwendet werden. Dies ermöglicht eine Vernetzung der
projektspezifischen Typen mit bereits bestehenden Online-Ressourcen oder
(falls diese nicht vorhanden sind) mit gedruckten Werken. Soweit
möglich werden die Lemma-Listen von Partnerprojketen vollständig
importiert, ansonsten werden die Einträge in dieser Tabelle bei Bedarf
manuell angelegt.
Die Verknüpfung mit den jeweiligen Typen wird in der Tabelle
`VTBL_morph_Typ_Lemma` angegeben. Eine entsprechende Tabelle gibt es auch für Basistypen:
`lemmata_basistypen`
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_lemma | int(10) unsigned | beliebig | Eindeutige ID. |
quelle | varchar(50) | beliebig | Fremdschlüssel, der auf einen der Einträge in Tabelle `bibliographie` verweist, der als "Referenzwörterbuch" markiert ist. |
subvocem | varchar(100) | beliebig | Enthält die orthographische Darstellung des Lemmas, so wie es in der Quelle angeben wird.
Diese Tabelle enthält auch Pseudo-Referenzen, für die dieses Feld den
Wert "<vacat>" enthält. Mit diesen werden morpho-lexikalische
Typen verknüpft, die in der jeweiligen Quelle keine Entsprechung haben
und dadurch trotzdem als "bearbeitet" markiert werden können. Diese
Pseudo-Referenzen werden nicht in die Tabelle `z_ling` übernommen und tauchen somit nicht an der Oberfläche auf. |
bibl_verweis | varchar(100) | beliebig | Enthält
zusätzliche Angaben zur Position des Lemmas, beispielweise eine
Seitenzahl etc. Die ist im Normalfall nur für gedruckte Werke relevant. |
link | varchar(200) | beliebig | Gibt (falls vorhanden) einen Link auf den entsprechenden Artikel an. |
angelegt_von | varchar(100) | beliebig | Wordpress-
Nutzername der Person, die dieses Lemma angelegt hat. Für vollständig
importierte Lemma-Listen wird "admin" verwendet, für automatisch
angelegte "vacat"-Referenzen "auto". |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
kommentar_intern | varchar(1000) | beliebig | Interne Bemerkung, die nicht an der Oberfläche auftaucht. |
genera | enum | '','f','m','n','f+m','f+n','m+n','f+m+n' | Gibt an, welches Genus bzw. welche Genera das Lemma in der jeweiligen Quelle hat. |
text_referenz | tinyint(1) | beliebig | Gibt an, dass diese Referenz sich nicht auf das angegebene Lemma an sich bezieht, sondern die Entsprechung des jeweiligen VA-
Typs nur im Artikel genannt wird. Somit kann für Formen, die in der
entsprechenden Quelle kein Lemma darstellen trotzdem eine (ungenauere)
Referenz angeben werden. An der Oberfläche werden diese Referenzen
zusätzlich mit dem Präfix "s. v." versehen. |
Identifikationsnummer
VerbaAlpina
siehe
Tabelle lemmata_basistypen
BeschreibungDiese Tabelle speichert Lemmata aus verschiedenen Wörterbüchern, die von VerbaAlpina als Referenzwörterbücher für
Basistypen
verwendet werden. Dies ermöglicht eine Vernetzung der
projektspezifischen Typen mit bereits bestehenden Online-Ressourcen oder
(falls diese nicht vorhanden sind) mit gedruckten Werken. Soweit
möglich werden die Lemma-Listen von Partnerprojketen vollständig
importiert, ansonsten werden die Einträge in dieser Tabelle bei Bedarf
manuell angelegt.
Die Verknüpfung mit den jeweiligen Typen wird in der Tabelle
`VTBL_Basistyp_Lemma` angegeben. Eine entsprechende Tabelle gibt es auch für morpho-lexikalische Typen:
`lemmata`
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_lemma | int(10) unsigned | beliebig | Eindeutige ID. |
quelle | varchar(50) | beliebig | Fremdschlüssel, der auf einen der Einträge in Tabelle `bibliographie` verweist, der als "Referenz_Basistyp" markiert ist. |
subvocem | varchar(100) | beliebig | Enthält die orthographische Darstellung des Lemmas, so wie es in der Quelle angeben wird.
Diese Tabelle enthält auch Pseudo-Referenzen, für die dieses Feld den
Wert "<vacat>" enthält. Mit diesen werden Basistypen verknüpft,
die in der jeweiligen Quelle keine Entsprechung haben und dadurch
trotzdem als "bearbeitet" markiert werden können. Diese
Pseudo-Referenzen werden nicht in die Tabelle `z_ling` übernommen und tauchen somit nicht an der Oberfläche auf. |
bibl_verweis | varchar(100) | beliebig | Enthält
zusätzliche Angaben zur Position des Lemmas, beispielweise eine
Seitenzahl etc. Die ist im Normalfall nur für gedruckte Werke relevant. |
link | varchar(200) | beliebig | Gibt (falls vorhanden) einen Link auf den entsprechenden Artikel an. |
angelegt_von | varchar(100) | beliebig | Wordpress-
Nutzername der Person, die diese Zuordnung erstellt hat. Für vollständig
importierte Lemma-Listen wird "admin" verwendet. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
kommentar_intern | varchar(1000) | beliebig | Interne Bemerkung, die nicht an der Oberfläche auftaucht. |
text_referenz | tinyint(1) | beliebig | Gibt an, dass diese Referenz sich nicht auf das angegebene Lemma an sich bezieht, sondern die Entsprechung des jeweiligen VA-
Typs nur im Artikel genannt wird. Somit kann für Formen, die in der
entsprechenden Quelle kein Lemma darstellen trotzdem eine (ungenauere)
Referenz angeben werden. An der Oberfläche werden diese Referenzen
zusätzlich mit dem Präfix "s. v." versehen. |
Identifikationsnummer
VerbaAlpina
siehe
Tabelle medien
Beschreibung
Verknüpft
Medien aus der Wordpress-Mediathek mit entsprechenden Metadaten. Beim
Upload wird automatisch ein Eintrag erstellt, der über den Dateinamen
mit dem ensprechenden Medium verknüpft ist. Die Metadaten selbst können
über die Wordpress-Mediathek eingetragen werden.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_medium | int(10) unsigned | beliebig | Eindeutige ID |
dateiname | varchar(200) | beliebig | Dateiname auf dem Server von VerbaAlpina |
gegenstand | varchar(500) | beliebig | Textuelle Beschreibung des Gegenstands des Mediums |
ursprung | varchar(500) | beliebig | Quelle des Bildes. Enthält entweder einen direkten Link oder die Angabe einer Institution, von der das Medium stammt. |
fotograf | varchar(200) | beliebig | Name der Person, die das Medium erstellt hat. |
datum_aufnahme | date | beliebig | Datum der Erstellung |
datum_download | date | beliebig | Datum des Downloads (falls anwendbar) |
copyright | enum | '','geschützt','frei','unklar' | Copyright-Status des Mediums |
rechteinhaber | varchar(250) | beliebig | Rechteinhaber des Mediums |
kontaktadresse | varchar(500) | beliebig | Kontaktadresse der Institution, die dieses Medium zur Verfügung gestellt hat (falls anwendbar) |
bemerkungen | varchar(1000) | beliebig | Feld für interne Notizen |
georeferenzierung | pointDieser
Datentyp speichert geometrische Daten in MySQL-Datenbanken. Die
einfachste Möglichkeit diese manuell einzutragen, ist die Verwendung der
GeomFromText-Funktion. Diese erlaubt die Eingabe der Daten im WKT-Format. Alle
geographischen Koordinaten in VerbaAlpina werden in der Reihenfolge
<Längengrad>, <Breitengrad> angegeben. Die Eingabe eines
Punktes mit den Koordinaten Breitengrad 48.135876 und Längengrad
11.583720 könnte somit folgendermaßen über die phpMyAdmin-Oberfläche angegeben werden: | beliebig | Georeferenzierung des Aufnahmeorts (falls anwendbar) |
genauigkeit_geo | enum | 'nicht spezifiziert','objektgenau','gemeindegenau','ungefähre Angabe' | Genauigkeit der Georeferenzierung (falls anwendbar) |
abkuerzung_bibliographie | varchar(50) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie` verweist. |
vorhanden | enum | '','ja','nein' | Marker,
um zu markieren, wenn ein Bild gelöscht wurde. Dies sollte im
Normalfall nicht vorkommen und wurde im späteren Projektverlauf
technisch unmöglich gemacht. |
lizenz | enum | '','GNU
Free Documentation
License','Copyright','https://creativecommons.org/licenses/by-
sa/2.0/','CC BY-SA 3.0','CC BY 2.5','CC BY-SA 2.5','CC BY 3.0','Public
domain','CC BY-SA 4.0','GFDL 1.2','CC BY 2.0','CC BY-SA 2.0','CC BY
1.0','CC BY 4.0','CC BY-SA 3.0 IGO' | Lizenz, unter der das Medium veröffentlicht wurde |
Identifikationsnummer
Tabelle morph_typen
BeschreibungListet die von VerbaAlpina verwendeten morpho-lexikalischen Typen (
vgl. Typisierung)
und zusätzlich weitere Typen, die aus Quellen übernommen wurden, die
ausschließlich bereits typsiertes Material enthalten. Ist letzteres der
Fall ist der entsprechende Beleg mit (mindestens) zwei
morpho-lexikalischen Typen verknüpft, die unter Umständen in ihrer
Transkription voneinander abweichen. Somit ist z.B. der Beleg
"Milchgmaach" aus dem
SDS entsprechend mit dem
SDS-Typ "Milchgmaach" verknüpft, aber auch mit dem
VA-Typ "Milchgemach".
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_morph_typ | int(10) unsigned | beliebig | Eindeutige ID des morpho-lexikalischen Typs. An der Oberfläche werden diese IDs mit dem Präfix "M" verwendet (vgl. Identifikatoren). |
beta | varchar(200) | beliebig | Transkription des Typs im Betacode |
orth | varchar(200) | beliebig | Orthographische Schreibweise des Typs soweit wie möglich im Alphabet der jeweiligen Sprache |
sprache | enum | '','sla','roa','gem' | Sprachfamilie des Typs |
wortart | enum | '','v','art','sub','pron','adj','PPP','PPA','adv','num','praep','konj','mod','int','mwe','Präfix' | Wortart des Typs |
affix | varchar(20) | beliebig | Alle Affixe des Typs (falls vorhanden) |
praefix | varchar(15) | beliebig | Präfix (falls vorhanden) |
infix | varchar(15) | beliebig | Infix (falls vorhanden) |
suffix | varchar(15) | beliebig | Suffix (falls vorhanden) |
genus | enum | '','m','f','n' | Genus des Typs |
quelle | varchar(100) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie`
verweist. Gibt die Quelle des morph-lexikalischen Typs an. Die
projekteigene Typisierung findet ausschließlich mit Typen mit Quelle "VA" statt. Andere Typen stammen aus Quellen, die nur bereits typisiertes Material enthalten. |
angelegt_von | varchar(100) | beliebig | Wordpress-
Nutzername der Person, die diesen morpho-lexikalischen Typ angelegt hat.
Bei älteren, manuell in der Datenbank erstellten Einträgen nicht
konsequent ausgefüllt. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
kommentar_intern | varchar(1000) | beliebig | Feld für interne Notizen |
Bibliographie
- SDS
= Baumgartner, Heinrich/ Handschuh, Doris/ Hotzenköcherle, Rudolf
(1962-2003): Sprachatlas der Deutschen Schweiz, Bern, vol. 1-9, Francke
Baumgartner,
Heinrich/ Handschuh, Doris/ Hotzenköcherle, Rudolf (1962-2003):
Sprachatlas der Deutschen Schweiz, Bern, vol. 1-9, Francke
vergleiche
Sprachatlas der deutschen Schweiz
VerbaAlpina
Identifikationsnummer
Substantiv
Tabelle orte
BeschreibungDiese Tabelle enthält ergänzende georeferenzierte Daten zu den sprachlichen Kerndaten. Auf der
interaktiven Karte sind sie unter den Rubriken "Ergänzende Daten" und "Flächen und Regionen" zugreifbar.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_ort | int(10) unsigned | beliebig | Eindeutige ID des Orts. |
id_kategorie | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `orte_kategorien` verweist. |
name | varchar(100) | beliebig | Name des Eintrags (z.B. Gemeindename, Name eines Klosters, etc.) |
beschreibung | text | beliebig | Beschreibung des Eintrags. |
geodaten | geometryDieser
Datentyp speichert geometrische Daten in MySQL-Datenbanken. Die
einfachste Möglichkeit diese manuell einzutragen, ist die Verwendung der
GeomFromText-Funktion. Diese erlaubt die Eingabe der Daten im WKT-Format. Alle
geographischen Koordinaten in VerbaAlpina werden in der Reihenfolge
<Längengrad>, <Breitengrad> angegeben. Die Eingabe eines
Punktes mit den Koordinaten Breitengrad 48.135876 und Längengrad
11.583720 könnte somit folgendermaßen über die phpMyAdmin-Oberfläche angegeben werden: | beliebig | Georeferenzierung des Eintrags. Kann (Multi-)Polygone, Linienzüge oder Punkte enthalten. |
alpenkonvention | tinyint(1) | beliebig | Dieser Wert gibt an, ob sich der Eintrag innerhalb der Alpenkonvention befindet (1) oder nicht (0). Für Punktdaten kann dieser Wert mit dem Befehl
ST_WITHIN(Geodaten, (SELECT Geodaten FROM Orte WHERE Id_Kategorie = 1))
berechnet werden. Für Polygone und Linienzüge werden alle Einträge, die
das Perimeter der Alpenkonvention schneiden als "in der Alpenkonvention"
markiert. Der Wert kann somit mit
ST_INTERSECTS(Geodaten, (SELECT Geodaten FROM Orte WHERE Id_Kategorie = 1))
berechnet werden. |
mittelpunkt | pointDieser
Datentyp speichert geometrische Daten in MySQL-Datenbanken. Die
einfachste Möglichkeit diese manuell einzutragen, ist die Verwendung der
GeomFromText-Funktion. Diese erlaubt die Eingabe der Daten im WKT-Format. Alle
geographischen Koordinaten in VerbaAlpina werden in der Reihenfolge
<Längengrad>, <Breitengrad> angegeben. Die Eingabe eines
Punktes mit den Koordinaten Breitengrad 48.135876 und Längengrad
11.583720 könnte somit folgendermaßen über die phpMyAdmin-Oberfläche angegeben werden: | beliebig | Für
(Multi-)Polygone wird in diesem Feld der (geometrische) Mittelpunkt
angegeben. Für alle anderen Datentypen ist der Wert NULL. |
id_extern | int(10) unsigned | beliebig | Die meisten Einträge der orte-Tabelle werden aus anderen Datenbanken (vor allem tools) importiert. Die genauen Angaben, welche Kategorien aus welchen Tabellen importiert werden, finden sich unter `orte_kategorien`.
Dieses Feld speichert für solche Einträge die Id des entsprechendne
Eintrags in der externen Tabelle und ermöglicht somit die automatisierte
Übernahme von Änderungen im Ursprungsmaterial. |
geaendert_am | timestamp | beliebig | Zeitpunkt
der letzten Änderung. Dieses Feld ist hauptsächlich nötig, um zu
erkennen, für welche Einträge die entsprechenden Quantifizierungsdaten
in der Tabelle `a_ort_polygon` neu berechnet werden müssen. |
quant_datum | timestamp | beliebig | Zeitpunkt, am dem für diesen Eintrag die entsprechenden Quantifizierungsdaten in der Tabelle `a_ort_polygon` erstellt wurden. Wenn dieser Wert kleiner ist, als der Wert im Feld "geaendert_am" müssen diese neu berechnet werden. |
gnd | varchar(20) | beliebig | Dient zur Angabe einer GND-Nummer für diesen Eintrag. Aktuell nicht in Verwendung. |
geonames | int(10) unsigned | beliebig | Dient zur Angabe einer ID in der Geonames-Datenbank für diesen Eintrag.
Für die Orte der Kategorie "Gemeindegrenzen" wurden die entsprechenden
Einträge automatisiert mit den IDs verknüpft. Wenn diese Spalte den Wert
"0" (im Gegensatz zu NULL) enthält, konnte hierfür keine eindeutige ID gefunden werden. |
vinko | tinyint(1) | beliebig | Nur für Gemeinden relevant. Gibt an, ob die Gemeinde im Partner-Projekt VinKo behandelt wurde (1) oder nicht (0). |
qid | int(10) unsigned | beliebig | Entsprechende QID eines Wikidata-Eintrags für diesen Ort (Der Präfix "Q" ist nicht enthalten). |
eth_id | varchar(20) | beliebig | Gibt (falls vorhanden) die ID eines entsprechenden Eintrags in der ETHorama-Datenbank der ETH Zürich an. |
Identifikationsnummer
Tabelle orte_hierarchien
Beschreibung
Verknüpft
Orte untereinander, um deren hierarchische Struktur abzubilden (z.B.
die Zugehörigkeit einer Gemeinde zu einem Landkreis). Enthält nur
direkte Verknüpfungen, solche die sich über mehrere Ebenen erstrecken
(z.B. Gemeinde -> Nationalstaat), werden automatisiert in der Tabelle
`a_orte_hierarchien_erweitert` erstellt.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_ort | int(10) unsigned | beliebig | Der entsprechende Ort. Fremdschlüssel, der auf die Tabelle `orte` verweist. |
id_ueberort | int(10) unsigned | beliebig | Der übergeordnete Ort. Fremdschlüssel, der auf die Tabelle `orte` verweist. |
Tabelle orte_kategorien
BeschreibungGruppiert die Einträge aus der Tabelle
`Orte` zu verschiedenen Kategorien und gibt die Werte an, die auf der
interaktiven Karte
in den Auswahlmenüs "Flächen und Regionen" sowie "Ergänzende Daten"
gewählt werden können. Weiterhin enthält diese Tabelle auch
Informationen zur Quelle und zum Import der Daten.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_kategorie | int(10) unsigned | beliebig | Eindeutige ID
der Kategorie. An der Oberfläche werden diese IDs mit dem Präfix "A" (=
Area) für Polygon-Daten und "E" (= Extra lingual) für sonstige Daten
verwendet (vgl. Identifikatoren). |
ebene_1 | varchar(100) | beliebig | Erste Ebene für die hierarchische Auswahl unter "Ergänzende Daten". Für Polygondaten wird diese Information nicht verwendet. |
ebene_2 | varchar(100) | beliebig | Zweite
(falls vorhanden) Ebene für die hierarchische Auswahl unter "Ergänzende
Daten". Für Polygondaten wird diese Information nicht verwendet. |
ebene_3 | varchar(100) | beliebig | Dritte
(falls vorhanden) Ebene für die hierarchische Auswahl unter "Ergänzende
Daten". Für Polygondaten wird diese Information nicht verwendet. |
ebene_4 | varchar(100) | beliebig | Vierte
(falls vorhanden) Ebene für die hierarchische Auswahl unter "Ergänzende
Daten". Für Polygondaten wird diese Information nicht verwendet. |
ebene_5 | varchar(100) | beliebig | Fünfte
(falls vorhanden) Ebene für die hierarchische Auswahl unter "Ergänzende
Daten". Für Polygondaten wird diese Information nicht verwendet. |
tiefe_name | int(11) | beliebig | Gibt
an, auf welcher Ebene der eigentliche Name der Kategorie steht. Alle
darauf folgenden Felder des Typs Kategorie_x sind leer. |
anzeige | tinyint(1) | beliebig | Gibt an, ob diese Kategorie an der Oberfläche zugreifbar sein soll. |
autor | varchar(100) | beliebig | Gibt an, welche Person diese Daten importiert bzw. erstellt hat. |
importiert_am | timestamp | beliebig | Datum des (letzten) Imports der Daten |
quelle | varchar(100) | beliebig | Quelle der Daten. Gibt entweder eine URL oder den Namen einer anderen ITG-Datenbank-Tabelle an. |
importfunktion | varchar(100) | beliebig | Gibt eine Datenbank-Prozedur an, die diese Daten (re-)importiert (falls vorhanden). |
Identifikationsnummer
vergleiche
Uniform Resource Locator
IT-Gruppe Geisteswissenschaften (
LMU Center for Digital Humanities)
Ludwig-Maximilians-Universität München
BeschreibungWeist Einträgen aus der Tabelle
`Orte` Tags einer bestimmten Kategorie zu. Dies wird für die (optionale) Gruppierung der Elemente auf der
Interaktive Karte verwendet. Beispielsweise wird den Polygonen der Gemeinden der jeweilige Nationalstaat zugeordnet.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_ort | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `orte` verweist. |
tag | varchar(200) | beliebig | Typ des Tags (z.B. LAND) |
wert | varchar(200) | beliebig | Wert des Tags (z.B. deu) |
Tabelle orte_uebersetzungen
BeschreibungGibt (falls vorhanden) Übersetzungen von verschiedenen Ortsnamen an, die in der jeweiligen
Oberflächensprache verwendet werden. Die Bezeichnungen in der Tabelle
`Orte` stammen aus den
Urspungsdaten.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_ort | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `orte` verweist. |
sprache | enum | 'D','E','F','I','S','R','L' | Sprache der Übersetzung |
name | varchar(500) | beliebig | Übersetzung |
Tabelle phon_typen
Beschreibung
Diese
Tabelle listet phonologische Typen, die Belege nach phonetischen
Merkmalen gruppieren. Da der Fokus von VerbaAlpina nicht auf der
Phonetik liegt, findet keine phonetische Typsierung im Projekt selbst
statt. Die Einträge in dieser Tabelle sind somit grundsätzlich aus
externen Quellen übernommen, falls diese keinen grundlegenden
Einzelbeleg, sondern bereits vortypisiertes Sprachmaterial enthalten.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_phon_typ | int(11) unsigned | beliebig | Eindeutige ID |
beta | varchar(200) | beliebig | Transkription des Typs im Betacode |
original | varchar(200) | beliebig | Darstellung des Typs, wie dieser im Quellenmaterial angegeben war (aktuell nicht in Verwendung) |
ipa | varchar(200) | beliebig | IPA-Darstellung des Typs. Wird automatisiert mit Hilfe der Tabelle `codepage_ipa` generiert. |
wortart | enum | '','v','art','sub','pron','adj','PPP','PPA','adv','num','praep','konj','mod','int' | Wortart des Typs (aktuell nicht in Verwendung) |
affix | varchar(20) | beliebig | Affix des Typs (aktuell nicht in Verwendung) |
genus | enum | '','m','f','n' | Genus des Typs (soweit bekannt) |
numerus | enum | '','sg','pl' | Numerus des Typs (aktuell nicht in Verwendung) |
quelle | varchar(50) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie` verweist. Verweist auf die Quelle, aus der dieser Typ übernommen wurde. |
kommentar_intern | varchar(200) | beliebig | Feld für interne Notizen. |
Identifikationsnummer
International Phonetic Alphabet
Substantiv
Tabelle stimuli
BeschreibungDiese
Tabelle listet Stimuli für alle von VerbaAlpina verwendeten Quellen.
Die Nachvollziehbarkeit der Herkunft eines Sprachbelegs innerhalb der
jeweiligen Quelle wird durch den Stimulus und den
`Informanten`
gewährleistet. Der Begriff "Stimulus" beschreibt prinzipiell, wodurch
die Antwort eines Informanten ausgelöst wurde, wird hier aber je nach
Quellentyp weiter gefasst:
- Fragebücher: Die jeweilige Frage
- Sprachatlanten: Der Name der jeweiligen Karte
- Wörterbücher: Das jeweilige Lemma
- Belege aus dem Crowdsourcing-Tool:
In diesem Fall wird der Name bzw. die Beschreibung des jeweiligen
Konzepts in der vom Nutzer gewählten Portalsprache angegeben. Dies
entspricht dem Text, der dem Nutzer im Portal angezeigt wurde. Wenn sich
die Verschriftlichung eines Konzepts nachträglich ändert, bleibt so
weiterhin nachvollziehbar, welcher Text dem Nutzer zum Zeitpunkt der
Eingabe angezeigt wurde.
Der Stimulus ist somit oft die Verschriftlichung eines Konzepts. Gerade
bei den Sprachatlanten entspricht der Kartenname in vielen Fällen dem
Konzept der dort aufgeführten Sprachbelege. Dieses kann allerdings bei
einzelnen Belegen abweichen (z.B. weil es durch zusätzliche Bemerkungen
genauer spezifiziert wird) und wird bei der
Transkription deshalb manuell angegeben (siehe
`vtbl_aeusserung_konzept`).
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_stimulus | int(10) unsigned | beliebig | Eindeutige ID. |
erhebung | varchar(20) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie`
verweist. Quelle, aus der dieser Stimulus übernommen wurde. Für Belege,
die von VerbaAlpina selbst erhoben wurden, wird der Wert "Crowd"
verwendet. |
karte | varchar(20) | beliebig | Gibt
für Sprachatlanten die Nummer der jeweiligen Karte und für andere
Quellentypen einen dem entsprechenden "Schlüssel" an. In den meisten
Fällen ist das ein numerischer Wert (z.B. auch die Nummer eines Lemmas
in einem Wörterbuch), es sind prinzipiell aber beliebige Zeichen
erlaubt.
Bei Belegen aus dem Crowdsourcing-Tool wird hier die `Konzept`-ID und durch einen Unterstrich getrennt die vom Nutzer gewählte Portalsprache angegeben. |
nummer | varchar(5) | beliebig | Dieses
Feld wird verwendet, um eine weitere Unterteilung des im Feld "Karte"
gegebenen Eintrags zu ermöglichen. Beispielsweise enthalten gewisse
Karten in Sprachatlanten auf einer Hauptkarte mehrere "Unterkarten", die
dann durch dieses Feld unterschieden werden können. Das erste Element
hat die Nummer 1, eventuelle weitere werden aufsteigend nummeriert. In
Ausnahmefällen kann dieses Feld auch nicht numerische Zeichen enthalten,
z.B. falls die Quelle selbst bereits eine Aufzähung mit a, b, c...
verwendet.
Bei Belegen aus dem Crowdsourcing-Tool
werden hier die Änderungen der Konzeptbeschreibung bzw. des
Konzeptnames dokumentiert. Wenn ein Nutzer zum ersten Mal einen Begriff
für ein Konzept in einer der Portalsprachen angibt, wird ein Stimulus
mit der Numemr 1 erstellt. Falls sich die Darstellung des Konzepts in
dieser Sprache nachträglich ändert, wird ein neuer Stimulus mit der
geänderten Darstellung des Konzepts und der Nummer 2 erstellt etc. |
stimulus | varchar(1000) | beliebig | Textuelle Repräsentation des jeweiligen Stimulus. |
va_phase | enum | '','0','1','1a','2','3','4','2a' | Angabe der Projektphase, in der dieser Stimulus transkribiert/verarbeitet wurde. |
bemerkung | varchar(1000) | beliebig | Freitextfeld für Bemerkungen. |
id_extern | varchar(100) | beliebig | Externe ID, falls dieser Stimulus aus einer Partner-Datenbank (vgl. Kooperation) stammt. |
Identifikationsnummer
vergleiche
BeschreibungListet die verschiedenen Kategorien, die den Einträgen unter
Methodologie zugeordnet werden können.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_tag | int(10) unsigned | beliebig | Endeutige ID. |
tag | varchar(100) | beliebig | Deutscher Begriff |
tag_e | varchar(100) | beliebig | Englischer Begriff |
qid | int(10) unsigned | beliebig | Gibt die ID in der Wikidata-Datenbank (https://www.wikidata.org/) an, die diesem Eintrag entspricht (Der Präfix "Q" ist nicht enthalten). |
Identifikationsnummer
Tabelle tokengruppen
BeschreibungTokengruppen
werden verwendet, wenn ein bestimmtes Konzept von einem aus mehreren
Tokens bestehenden Ausdruck bezeichnet wird, z.B.
fior de lˈate. Bei der Tokensierung wird grundsätzlich für jedes Token ein Eintrag unter
`Tokens` erstellt und (falls nötig) ein weiterer Eintrag in dieser Tabelle, mit dem mehrere Tokens gruppiert werden können.
Es wird keine Gruppe erstellt, wenn der Beleg nur aus Artikel + Nomen besteht.
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_tokengruppe | int(10) unsigned | beliebig | Eindeutige ID der Tokengruppe. An der Oberfläche werden diese IDs mit dem Präfix "G" verwendet (vgl. Identifikatoren). |
genus | enum | '','m','f','n' | Genus der Tokengruppe |
numerus | enum | '','sg','pl' | Numerus der Tokengruppe |
bemerkung | varchar(500) | beliebig | Feld für interne Notizen |
Identifikationsnummer
vergleiche
Tabelle tokens
BeschreibungEnthält die tokenisierten Daten aus der Tabelle
`Aeusserungen`. Die Einträge dieser Tabelle (zusammen mit den Daten aus
`Tokengruppen`,
mit denen mehrere Tokens zu einer Mehrwortlexie zusammengefasst werden
können) bilden somit den Kern der Projektdaten von VerbaAlpina.
Die Felder aus dieser Tabelle stimmen in vielen Fällen mit denen aus der Tabelle
`Aeusserungen` überein und werden bei der Tokenisierung direkt übernommen.
Die Tabelle
`aeusserungen`
kann mehrere Belege in einer Zeile enhalten, falls ein Informant mehrere
Belege geliefert hat. Diese werden entweder durch ein Semikolon
(verschiedene Worttypen) oder ein Komma getrennt. Hier wird dies durch
die Verwendung von drei Indexen in den Feldern Ebene_1, Ebene_2 und
Ebene_3 abgebildet. Ebene_1 bezieht sich auf Teile der Äußerung, die
durch ein Semikolon getrennt wurde, Ebene_2 auf solche, die durch ein
Komma getrennt wurden und Ebene_3 auf die eigentliche Tokensierung des
Beleges. Die Äußerung "la ṣẹ kū́la, si dé̜sfa; a kulársẹ" wird
also beispielsweise auf 8 Tokens mit den folgenden Indexen aufgeteilt:
Token | Ebene_1 | Ebene_2 | Ebene_3 |
la | 1 | 1 | 1 |
ṣẹ | 1 | 1 | 2 |
kū́la | 1 | 1 | 3 |
si | 1 | 2 | 1 |
dé̜sfa | 1 | 2 | 2 |
a | 2 | 1 | 1 |
kulársẹ | 2 | 1 | 2 |
Diese Tabelle wird von folgenden Tabellen referenziert:
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_token | int(11) unsigned | beliebig | Eindeutige ID des Tokens. An der Oberfläche werden diese IDs mit dem Präfix "S" (= Single) verwendet (vgl. Identifikatoren). |
id_informant | int(11) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `informanten` verweist. Informant, von dem dieser Beleg stammt. Direkt aus der Tabelle `Aeusserungen` übernommen. |
id_stimulus | int(11) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `stimuli` verweist. Stimulus, durch den dieser Beleg produziert wurde. Direkt aus der Tabelle `Aeusserungen` übernommen. |
token | varchar(200) | beliebig | Basistranskription des Tokens. Je nach Quelle sind unterschiedliche Transkriptionssysteme möglich:
- Von VerbaAlpina transkribierte Belege sind im Betacode. Die entsprechenden Quellen sind in der Tabelle `Bibliographie` mit dem Flag VA_Beta markiert.
- Von VerbaAlpina über das Crowdsourcing-Tool erhoben wurden, entsprechen der Eingabe des Nutzenden.
- Alle Belege aus anderen Quellen sind in einer quellenspezifischen Transkription (IPA, eigener Betacode, etc.)
Für Belege, die im Quellenmaterial ausschließlich bereits typsiert
angegeben werden, ist dieses Feld leer. Die Quellentranskription ist
über einen quellenspezifischen `phonetischen` oder `morpho-lexikalischen Typ` angegeben, der mit dem Token verknüpft ist. |
ipa | varchar(200) | beliebig | IPA-Darstellung des Belegs. Für Quellen, die im VA-eigenen Betacode oder einem anderen systematischen Transkriptionssystem angegeben sind, wird die IPA-Darstellung automatisiert mit Hilfe der Tabelle `codepage_ipa` generiert. Für Quellenmaterial, das bereits IPA-kodiert war, entspricht dieses Feld dem Eintrag im Feld "token". Für alle weiteren Quellen (besonders Belege aus dem Crowdsourcing-Tool wird aktuell keine eigene IPA-Darstellung angegeben, da diese manuell erstellt werden müsste) |
original | varchar(4000) | beliebig | Darstellung des Belegs, wie dieser im Quellenmaterial angegeben war. Dieses Feld ist primär für Tokens im Betacode
relevant, aber auch für andere Quellen, deren Datenmaterial in einer
nicht-menschenlesbaren Form kodiert ist. Die Einträge in diesem Feld
werden automatisiert mit Hilfe der Tabelle `codepage_original` für die dort geführten Quellen erzeugt. |
portalsprache | varchar(10) | beliebig | Nur relevant für Belege, die über das Crowdsourcing-Tool eingegeben werden. Gibt die Sprache an, die jeweilige Nutzer im Tool gewählt hat. Diese entspricht nicht der Sprache der Äußerung, sondern nur der der Oberfläche (Bedienelemente, Hinweise, etc.). Direkt aus der Tabelle `Aeusserungen` übernommen. |
id_aeusserung | int(11) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `aeusserungen` verweist. Gibt die vollständige Ursprungsäußerung an, aus der dieses Token stammt. |
erfasst_von | varchar(50) | beliebig | Nutzername der Person, die diese Äußerung eingegeben/importiert hat. Direkt aus der Tabelle `Aeusserungen` übernommen. |
erfasst_am | timestamp | beliebig | Zeitpunkt der Erstellung der zugeordneten Äußerung. Direkt aus der Tabelle `Aeusserungen` übernommen. |
version | tinyint(4) unsigned | beliebig | Aufsteigende
Nummer um redundante Mehrfachtranskriptionen zum Auffinden von Fehlern
zu ermöglichen. Dies wird aktuell nicht verwendet; das Feld enthält
somit immer den Wert 1. Direkt aus der Tabelle `Aeusserungen` übernommen. |
bemerkung | text | beliebig | Freitextfeld für Bemerkungen.
Falls die zugrundeliegende Äußerung eine Bemerkung hatte, wird dieses
hier dupliziert. Bei Belegen, die im Quellenmaterial ausschließlich
vortypisiert angegeben sind, wird hier zusätzlich die
Quellentransktiption angegeben (z.B. SDS-
Typ "Hütte"), da das Feld Token leer ist. Dies dient nur der
Vereinfachung der Projektarbeit, da diese Information grundsätzlich auch
durch die Verknüpfung mit einem entsprechenden quellenspezifischen Typ
vorhanden ist.
Zusätzlich sind eventuell weitere interne Notizen in diesem Feld möglich. |
ebene_1 | int(3) | beliebig | Index auf Ebene 1 (vgl. Tabellenbeschreibung) |
ebene_2 | int(3) | beliebig | Index auf Ebene 2 (vgl. Tabellenbeschreibung) |
ebene_3 | int(3) | beliebig | Index auf Ebene 3 (vgl. Tabellenbeschreibung) |
id_tokengruppe | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokengruppen` verweist. Falls dieses Token Teil einer Mehrwortlexie ist, enthält es hier die ID einer entsprechenden Tokengruppe. |
trennzeichen | varchar(10) | beliebig | Trennzeichen durch das dieses Token von nachfolgenden getrennt wird im Betacode. Für Tokens, die nicht Teil einer Mehrwortlexie
sind oder die das letzte Token einer solchen sind, ist diese Feld immer
NULL. Ansonsten enthält es aktuell entweder ein Leerzeichen oder {␣} (Betacode für einen Bogen, der zwei Tokens verbindet). |
trennzeichen_ipa | varchar(10) | beliebig | Trennzeichen durch das dieses Token von nachfolgenden getrennt wird in IPA. Für Tokens, die nicht Teil einer Mehrwortlexie
sind oder die das letzte Token einer solchen sind, ist diese Feld immer
NULL. Ansonsten enthält es aktuell entweder ein Leerzeichen oder ‿. |
trennzeichen_original | varchar(10) | beliebig | Trennzeichen
durch das dieses Token von nachfolgenden getrennt wird in
Originaldarstellung der Quelle. Für Tokens, die nicht Teil einer Mehrwortlexie
sind oder die das letzte Token einer solchen sind, ist diese Feld immer
NULL. Ansonsten enthält es aktuell entweder ein Leerzeichen oder ‿. |
genus | enum | '','f','m','n','?','n/a' | Genus des Tokens (falls anwendbar) |
pos | enum | '','v','art','sub','pron','adj','PPP','PPA','adv','num','praep','konj','mod','int' | Wortart des Tokens |
person | enum | '','1','2','3','n/a' | Grammatikalische Person des Tokens (falls anwendbar) |
tempus | enum | '','pres','impf','pasr','fut','n/a' | Tempus des Tokens (falls anwendbar) |
modus | enum | '','ind','cong','cond','imp','inf','n/a' | Modus des Tokens (falls anwendbar) |
numerus | enum | '','sg','pl','n/a' | Numerus des Tokens (falls anwendbar) |
komplement | varchar(20) | beliebig | Aktuell nicht in Verwendung |
chronoreferenz | char(9) | beliebig | Aktuell nicht in Verwendung. Für eine zeitliche Angabe der Verwendung vorgesehen. |
id_dialekt | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `dialects` verweist. Nur relevant für Belege, die über das Crowdsourcing-Tool
eingegeben werden. Gibt den im Tool ausgewählten Dialekt an. Da diese
Möglichkeit in älteren Versionen des Tools noch nicht gegeben war, gibt
es auch Crowdsourcing-Äußerungen, bei denen dieses Feld leer ist. Direkt
aus der Tabelle `Aeusserungen` übernommen. |
geaendert_am | timestamp | beliebig | Zeitpunkt der letzten Änderung |
Identifikationsnummer
vergleiche
VerbaAlpina
International Phonetic Alphabet
Sprachatlas der deutschen Schweiz
Substantiv
Tabelle ueberkonzepte
Beschreibung
Verknüpft
Konzepte untereinander, um eine Hierarchie abzubilden, z.B. KÄSE ->
KÄSE, AUS KUHMILCH etc. Es gibt für jedesDie Konzepte auf der höchsten
Ebene erhalten als Überkonzept das Pseudo-Konzept "(Konzepte)" (ID 707).
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_konzept | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte` verweist. |
id_ueberkonzept | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte` verweist. Gibt das übergeordnete Konzept an. |
Identifikationsnummer
Tabelle vtbl_aeusserung_bedeutung
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die nicht tokenisierten Sprachbelege aus der Tabelle
`aeusserungen` mit sprachabhängigen Bedeutungen (
vgl. `bedeutungen`).
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_aeusserung | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `aeusserungen` verweist. |
id_bedeutung | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `bedeutungen` verweist. |
vergleiche
Tabelle vtbl_aeusserung_konzept
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`aeusserungen` und
`konzepte` und speichert somit eine Zuordnung der in
VA verwendeten nicht tokenisierten Sprachbelege mit den jeweiligen Konzepten.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_aeusserung | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `aeusserungen` verweist. |
id_konzept | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte` verweist. |
unsicher | tinyint(1) | beliebig | Vorgesehen, um unsichere Konzeptzuweisungen zu markieren, aktuell nicht in Verwendung. |
VerbaAlpina
Tabelle vtbl_basistyp_lemma
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_basistyp | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `basistypen` verweist. |
id_lemma | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `lemmata_basistypen` verweist. |
angelegt_von | varchar(200) | beliebig | Wordpress-Nutzername der Person, die diese Zuordnung erstellt hat. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
VerbaAlpina
Tabelle vtbl_eintrag_autor
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`glossar` und
`personen` und speichert eine Zuordnung der Einträge unter dem Reiter
Methodologie zu ihren jeweiligen Autor*innen, Übersetzer*innen oder Korrekturleser*innen.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_eintrag | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `glossar` verweist. |
kuerzel | varchar(3) | beliebig | Fremdschlüssel, der auf die Tabelle `personen` verweist. |
aufgabe | enum | 'auct','trad','corr' | Art der Zuordnung:
- auct = Autor*in
- trad = Übersetzer*in
- corr = Korrekturleser*in
|
sprache | char(1) | beliebig | Sprachversion des Eintrags, auf den sich die Zuweisung bezieht. Entspricht den Abkürzungen aus der Tabelle `glossar`:
- D = Deutsch
- E = Englisch
- F = Französisch
- I = Italienisch
- L = Ladinisch
- R = Rätoromanisch
- S = Slowenisch
|
Tabelle vtbl_eintrag_tag
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`glossar` und
`tags` und speichert eine Zuordnung der Einträge unter dem Reiter
Methodologie zu ihren Kategorien.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_eintrag | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `glossar` verweist. |
id_tag | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tags` verweist. |
Tabelle vtbl_kommentar_autor
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`im_comments` und
`personen` und speichert eine Zuordnung der Einträge unter dem Reiter
Methodologie zu ihren jeweiligen Autor*innen, Übersetzer*innen oder Korrekturleser*innen. Dies erweitert die automatisch vom
Karten-Plugin erstellte
`im_comments`, die nur eine Person als Ersteller des Eintrags vorsieht.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_kommentar | varchar(10) | beliebig | ID des Kommentars in der Tabelle `im_comments`. Diese ID ist dort nicht eindeutig, weil die verschieden Sprachversionen die selbe ID aufweisen. |
kuerzel | char(3) | beliebig | Fremdschlüssel, der auf die Tabelle `personen` verweist. |
aufgabe | enum | 'auct','trad','corr' | Art der Zuordnung:
- auct = Autor*in
- trad = Übersetzer*in
- corr = Korrekturleser*in
|
sprache | char(1) | beliebig | Sprachversion des Eintrags, auf den sich die Zuweisung bezieht:
- D = Deutsch
- E = Englisch
- F = Französisch
- I = Italienisch
- L = Ladinisch
- R = Rätoromanisch
- S = Slowenisch
|
Identifikationsnummer
Tabelle vtbl_medium_konzept
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_medium | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `medien` verweist. |
id_konzept | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte` verweist. |
konzeptillustration | tinyint(1) | beliebig | Gibt an, ob dieses Bild als Illustration im Crowdsourcing-Tool verwendet werden soll (1) oder nicht (0). |
Tabelle vtbl_medium_typ
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_medium | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `medien` verweist. |
id_morph_typ | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `morph_typen` verweist. |
Tabelle vtbl_morph_basistyp
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`morph_Typen` und
`basistypen` und speichert somit eine Zuordnung der in
VA verwendeten morpho-lexikalischen Typen mit Basistypen (
vgl. Typisierung).
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_morph_typ | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `morph_typen` verweist. |
id_basistyp | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `basistypen` verweist. |
quelle | varchar(50) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie` verweist. Enthält aktuell immer den Wert "VA",
soll aber in Zukunft die Möglichkeit unterstützen nutzerbasierte
Typisierungen zu erstellen und diese mit entsprechenden Referenzen zu
versehen. |
angelegt_von | varchar(100) | beliebig | Wordpress-Nutzername der Person, die diese Zuordnung erstellt hat. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
unsicher | tinyint(1) | beliebig | Wird gesetzt, wenn die Wortherkunft unsicher ist. |
VerbaAlpina
vergleiche
Tabelle vtbl_morph_typ_bestandteile
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft Einträge aus der Tabelle
`morph_Typen` untereinander, falls der eine ein Bestandteil des anderen ist. Dies ist bei
Mehrwortlexien und Komposita der Fall. Der Nutzen ist primär eine indirekte Verknüpfung mit
`Basistypen` und
`externen Referenzen`, sodass diese nur den Bestandteilen und nicht auch den zusammgesetzen Typen explizit zugeordnet werden müssen.
Aus technischen Gründen werden morpho-lexikalische Typen ohne Bestandteile sich selbst zugeordnet.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_morph_typ | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `morph_typen` verweist. |
id_bestandteil | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `morph_typen` verweist. |
Tabelle vtbl_morph_typ_lemma
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_morph_typ | int(11) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `morph_typen` verweist. |
id_lemma | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `lemmata` verweist. |
quelle | varchar(50) | beliebig | Fremdschlüssel, der auf die Tabelle `bibliographie` verweist. Enthält aktuell immer den Wert "VA",
soll aber in Zukunft die Möglichkeit unterstützen nutzerbasierte
Typisierungen zu erstellen und diese mit entsprechenden Referenzen zu
versehen. |
angelegt_von | varchar(100) | beliebig | Wordpress-Nutzername der Person, die diese Zuordnung erstellt hat. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
VerbaAlpina
Tabelle vtbl_tokengruppe_bedeutung
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_tokengruppe | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokengruppen` verweist. |
id_bedeutung | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `bedeutungen` verweist. |
vergleiche
Tabelle vtbl_tokengruppe_konzept
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`tokengruppen` und
`konzepte` und speichert welche Konzepte einer Tokengruppe zugeordnet sind.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_tokengruppe | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokengruppen` verweist. |
id_konzept | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte` verweist. |
unsicher | tinyint(1) | beliebig | Vorgesehen, um unsichere Konzeptzuweisungen zu markieren, aktuell nicht in Verwendung. |
Tabelle vtbl_tokengruppe_morph_typ
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_tokengruppe | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokengruppen` verweist. |
id_morph_typ | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `morph_typen` verweist. |
angelegt_von | varchar(100) | beliebig | Wordpress-Nutzername der Person, die diese Zuordnung erstellt hat. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
Tabelle vtbl_tokengruppe_phon_typ
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`tokengruppen` und
`phon_typen`
und speichert somit die phonetische Typisierung der jeweiligen
Tokengruppe. Da VerbaAlpina keine phonetische Typisierung vornimmt,
stammt diese ausschließlich aus der jeweiligen Quelle (
vgl. `phon_typen`).
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_tokengruppe | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokengruppen` verweist. |
id_phon_typ | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `phon_typen` verweist. |
angelegt_von | varchar(100) | beliebig | Wordpress-Nutzername der Person, die diese Zuordnung erstellt hat. (Nicht konsequent befüllt) |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
vergleiche
Tabelle vtbl_token_bedeutung
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_token | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokens` verweist. |
id_bedeutung | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `bedeutungen` verweist. |
vergleiche
Tabelle vtbl_token_konzept
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`tokens` und
`konzepte` und speichert welche Konzepte einem Token zugeordnet sind.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_token | int(11) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokens` verweist. |
id_konzept | int(11) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `konzepte` verweist. |
unsicher | tinyint(1) | beliebig | Vorgesehen, um unsichere Konzeptzuweisungen zu markieren, aktuell nicht in Verwendung. |
Tabelle vtbl_token_morph_typ
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_token | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokens` verweist. |
id_morph_typ | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `morph_typen` verweist. |
angelegt_von | varchar(100) | beliebig | Wordpress-Nutzername der Person, die diese Zuordnung erstellt hat. |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
Tabelle vtbl_token_phon_typ
Vorbemerkung
Tabellen
mit dem Präfix "vtbl_" sind sogenannte "Verknüpfungstabellen", die eine
m:n Relation zwischen zwei Primärtabellen abbilden.
BeschreibungVerknüpft die Tabellen
`tokens` und
`phon_typen`
und speichert somit die phonetische Typisierung des jeweiligen Tokens.
Da VerbaAlpina keine phonetische Typisierung vornimmt, stammt diese
ausschließlich aus der jeweiligen Quelle (
vgl. `phon_typen`).
SpaltenDer
Name von Spalten, die Teil des Primärschlüssels sind wird fett
dargestellt, die Namen von Fremdschlüsseln unterstrichen. Kursivierte
Werte im Feld Datentyp bedeuten, dass der Wert optional (nullable) ist.
Spaltenname | Datentyp | Mögliche Werte | Beschreibung |
---|
id_token | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `tokens` verweist. |
id_phon_typ | int(10) unsigned | beliebig | Fremdschlüssel, der auf die Tabelle `phon_typen` verweist. |
angelegt_von | varchar(100) | beliebig | Wordpress-Nutzername der Person, die diese Zuordnung erstellt hat. (Nicht konsequent befüllt) |
angelegt_am | timestamp | beliebig | Zeitpunkt der Erstellung. |
vergleiche