Datensatz zur Dissertation mit dem Titel "Deutsche Entlehnungen im Russischen - auf Basis eines digital erstellten Korpus"

www.lmu.de | UB | Blättern | Hilfe

Zur erweiterten Suche

English

Zur erweiterten Suche

Zitation: Goll, Tamara: Datensatz zur Dissertation mit dem Titel "Deutsche Entlehnungen im Russischen - auf Basis eines digital erstellten Korpus". 16. April 2025. Open Data LMU. 10.5282/ubm/data.603

Datensatz zur Dissertation mit dem Titel "Deutsche Entlehnungen im Russischen - auf Basis eines digital erstellten Korpus"

Der Datensatz zur Dissertation "Deutsche Entlehnungen im Russischen - auf Basis eines digital erstellten Korpus" besteht aus insgesamt 6 Tabellen: rus_listen, rus_listen_distinct, rus_entlehnungen, rus_tokens, rus_meta, rus_kontext. rus_listen: Diese Tabelle enthält alle 24 Wörterlisten mit insgesamt 18.211 Wörtern und enthält neben den vielen Varianten auch einige Wiederholungen. rus_listen_distinct: Diese Tabelle weist 10.780 Wörter auf und besteht nur aus der Spalte Russisch. In dieser Spalte sind alle Suchwörter in kyrillischer Schrift verzeichnet. rus_entlehnungen: Diese Tabelle beinhaltet alle ursprünglich deutschen Entlehnungen, insgesamt 306 Lemmata. rus_tokens*: Diese Tabelle enthält das Teilkorpus des Russischen Nationalkorpus, eine Offline-Version. Insgesamt fasst das Korpus 1.001.460 Wörter. rus_meta*: Diese Tabelle enthält die Metadaten zum Teilkorpus. rus_kontext*: Diese Tabelle ermöglicht es KeyWords in Context (KWIC) zu betrachten. *Aus lizenzrechtlichen Gründen kann von den Tabellen rus_tokens, rus_meta und rus_kontext jeweils nur die Struktur exportiert werden, nicht die Daten. Die Dissertation untersucht deutsche Entlehnungen im Russischen, die durch interkulturellen Austausch entstanden sind. Trotz umfangreicher Forschung fehlen systematische Analysen zur aktuellen Verwendung. Mithilfe moderner korpuslinguistischer Methoden wird eine empirische Materialgrundlage geschaffen, einschließlich der Arbeit mit dem Russischen Nationalkorpus und einer umfassenden Erfassung deutscher Lehnwörter. Nach der Einführung werden Forschungsfragen und Arbeitshypothesen formuliert. Kapitel zwei gibt einen Überblick über die Forschung zu Entlehnungen, insbesondere im Russischen. Kapitel drei stellt bestehende Klassifikationsmodelle vor und entwickelt eine eigenständige Systematisierung deutscher Entlehnungen. Kapitel vier erläutert den Einsatz digitaler Korpora als Forschungsmethode, Kapitel fünf beschreibt die korpuslinguistische Methodik. Kapitel sechs bildet den analytischen Schwerpunkt: Es umfasst die Kategorisierung, etymologische Einordnung sowie phonetische, morphologische und semantische Analysen. Kapitel sieben fasst die Ergebnisse zusammen und skizziert Forschungsdesiderate. Ein Glossar deutscher Entlehnungen ergänzt die Arbeit.

The dataset for the dissertation titled "German Loanwords in Russian – Based on a Digitally Created Corpus" consists of a total of six tables: rus_listen, rus_listen_distinct, rus_entlehnungen, rus_tokens, rus_meta, and rus_kontext. rus_listen: This table contains all 24 word lists with a total of 18,211 words, including numerous variants as well as some repetitions. rus_listen_distinct: This table contains 10,780 words and consists only of the Russian column. This column lists all search words in Cyrillic script. rus_entlehnungen: This table includes all originally German loanwords, totaling 306 lemmas. rus_tokens*: This table contains the subcorpus of the Russian National Corpus, an offline version. The corpus comprises a total of 1,001,460 words. rus_meta*: This table contains the metadata for the subcorpus. rus_kontext*: This table enables the examination of keywords in context (KWIC). Due to licensing restrictions, only the structure of the tables rus_tokens, rus_meta, and rus_kontext can be exported, not the data itself. The dissertation examines German loanwords in Russian that have emerged through intercultural exchange. Despite extensive research, systematic analyses of their current usage are lacking. Using modern corpus linguistic methods, an empirical data basis is established, including work with the Russian National Corpus and a comprehensive collection of German loanwords. Following the introduction, research questions and working hypotheses are formulated. Chapter two provides an overview of research on loanwords, with a focus on Russian. Chapter three presents existing classification models and develops an independent systematization of German loanwords. Chapter four discusses the use of digital corpora as a research method, while chapter five outlines the corpus linguistic methodology. Chapter six forms the analytical core of the study, addressing categorization, etymological classification, as well as phonetic, morphological, and semantic analyses. Chapter seven summarizes the findings and outlines future research perspectives. A glossary of German loanwords supplements the study.

Linguistik, Entlehnung, Germanismus, Russistik, Germanistik, Korpus (Linguistik), Sprachkontakt

Goll, Tamara

16. Apr. 2025

2025

https://doi.org/10.5282/ubm/data.603

	Other (DataCite Metadaten) tgoll_metadata.xml - Zusätzliche Metadaten 8kB
	Plain Text (README Datei) tgoll_README.txt - Zusätzliche Metadaten 6kB
	Other (Datenbank zur Dissertation zu deutschen Entlehnungen im Russischen) tgoll.zip - Ergänzendes Material 638kB

DOI: 10.5282/ubm/data.603

Dieser Datensatz steht unter der Creative Commons Lizenz
CC BY-SA 4.0

Beschreibung

Stichwörter

Linguistik, Entlehnung, Germanismus, Russistik, Germanistik, Korpus (Linguistik), Sprachkontakt

Dokumententyp:	Daten
Name der Kontaktperson:	Goll, Tamara
E-Mail der Kontaktperson:	tamaragoll11 at gmail.com
Fächer:	Sprach- und Literaturwissenschaften
Dewey Dezimalklassifikation:	400 Sprache 400 Sprache > 410 Linguistik 400 Sprache > 430 Deutsch, germanische Sprachen allgemein 400 Sprache > 490 Andere Sprachen
ID Code:	603
Eingestellt von:	Tamara Goll
Eingestellt am:	16. Apr. 2025 12:31
Letzte Änderungen:	16. Apr. 2025 12:39

Nur für Administratoren und Editoren: Dokument bearbeiten

Dieser Datensatz steht unter der Creative Commons LizenzCC BY-SA 4.0

Be­schrei­bung

Be­schrei­bung

Stichwörter

Dieser Datensatz steht unter der Creative Commons Lizenz
CC BY-SA 4.0

Beschreibung

Beschreibung