Citation: Goll, Tamara: Datensatz zur Dissertation mit dem Titel "Deutsche Entlehnungen im Russischen - auf Basis eines digital erstellten Korpus". 16. April 2025. Open Data LMU. 10.5282/ubm/data.603
![]() |
Other (DataCite Metadaten)
tgoll_metadata.xml - Additional Metadata 8kB |
![]() |
Plain Text (README Datei)
tgoll_README.txt - Additional Metadata 6kB |
![]() |
Other (Datenbank zur Dissertation zu deutschen Entlehnungen im Russischen)
tgoll.zip - Supplemental Material 638kB |
DOI: 10.5282/ubm/data.603
This dataset is available unter the terms of the following Creative Commons LicenseCC BY-SA 4.0
Abstract
Der Datensatz zur Dissertation "Deutsche Entlehnungen im Russischen - auf Basis eines digital erstellten Korpus" besteht aus insgesamt 6 Tabellen: rus_listen, rus_listen_distinct, rus_entlehnungen, rus_tokens, rus_meta, rus_kontext. rus_listen: Diese Tabelle enthält alle 24 Wörterlisten mit insgesamt 18.211 Wörtern und enthält neben den vielen Varianten auch einige Wiederholungen. rus_listen_distinct: Diese Tabelle weist 10.780 Wörter auf und besteht nur aus der Spalte Russisch. In dieser Spalte sind alle Suchwörter in kyrillischer Schrift verzeichnet. rus_entlehnungen: Diese Tabelle beinhaltet alle ursprünglich deutschen Entlehnungen, insgesamt 306 Lemmata. rus_tokens*: Diese Tabelle enthält das Teilkorpus des Russischen Nationalkorpus, eine Offline-Version. Insgesamt fasst das Korpus 1.001.460 Wörter. rus_meta*: Diese Tabelle enthält die Metadaten zum Teilkorpus. rus_kontext*: Diese Tabelle ermöglicht es KeyWords in Context (KWIC) zu betrachten. *Aus lizenzrechtlichen Gründen kann von den Tabellen rus_tokens, rus_meta und rus_kontext jeweils nur die Struktur exportiert werden, nicht die Daten. Die Dissertation untersucht deutsche Entlehnungen im Russischen, die durch interkulturellen Austausch entstanden sind. Trotz umfangreicher Forschung fehlen systematische Analysen zur aktuellen Verwendung. Mithilfe moderner korpuslinguistischer Methoden wird eine empirische Materialgrundlage geschaffen, einschließlich der Arbeit mit dem Russischen Nationalkorpus und einer umfassenden Erfassung deutscher Lehnwörter. Nach der Einführung werden Forschungsfragen und Arbeitshypothesen formuliert. Kapitel zwei gibt einen Überblick über die Forschung zu Entlehnungen, insbesondere im Russischen. Kapitel drei stellt bestehende Klassifikationsmodelle vor und entwickelt eine eigenständige Systematisierung deutscher Entlehnungen. Kapitel vier erläutert den Einsatz digitaler Korpora als Forschungsmethode, Kapitel fünf beschreibt die korpuslinguistische Methodik. Kapitel sechs bildet den analytischen Schwerpunkt: Es umfasst die Kategorisierung, etymologische Einordnung sowie phonetische, morphologische und semantische Analysen. Kapitel sieben fasst die Ergebnisse zusammen und skizziert Forschungsdesiderate. Ein Glossar deutscher Entlehnungen ergänzt die Arbeit.
Abstract
The dataset for the dissertation titled "German Loanwords in Russian – Based on a Digitally Created Corpus" consists of a total of six tables: rus_listen, rus_listen_distinct, rus_entlehnungen, rus_tokens, rus_meta, and rus_kontext. rus_listen: This table contains all 24 word lists with a total of 18,211 words, including numerous variants as well as some repetitions. rus_listen_distinct: This table contains 10,780 words and consists only of the Russian column. This column lists all search words in Cyrillic script. rus_entlehnungen: This table includes all originally German loanwords, totaling 306 lemmas. rus_tokens*: This table contains the subcorpus of the Russian National Corpus, an offline version. The corpus comprises a total of 1,001,460 words. rus_meta*: This table contains the metadata for the subcorpus. rus_kontext*: This table enables the examination of keywords in context (KWIC). Due to licensing restrictions, only the structure of the tables rus_tokens, rus_meta, and rus_kontext can be exported, not the data itself. The dissertation examines German loanwords in Russian that have emerged through intercultural exchange. Despite extensive research, systematic analyses of their current usage are lacking. Using modern corpus linguistic methods, an empirical data basis is established, including work with the Russian National Corpus and a comprehensive collection of German loanwords. Following the introduction, research questions and working hypotheses are formulated. Chapter two provides an overview of research on loanwords, with a focus on Russian. Chapter three presents existing classification models and develops an independent systematization of German loanwords. Chapter four discusses the use of digital corpora as a research method, while chapter five outlines the corpus linguistic methodology. Chapter six forms the analytical core of the study, addressing categorization, etymological classification, as well as phonetic, morphological, and semantic analyses. Chapter seven summarizes the findings and outlines future research perspectives. A glossary of German loanwords supplements the study.
Uncontrolled Keywords
Linguistik, Entlehnung, Germanismus, Russistik, Germanistik, Korpus (Linguistik), Sprachkontakt
Item Type: | Data |
---|---|
Contact Person: | Goll, Tamara |
E-Mail of Contact: | tamaragoll11 at gmail.com |
Subjects: | Languages and Literatures |
Dewey Decimal Classification: | 400 Language 400 Language > 410 Linguistics 400 Language > 430 Germanic languages German 400 Language > 490 Other languages |
ID Code: | 603 |
Deposited By: | Tamara Goll |
Deposited On: | 16. Apr 2025 12:31 |
Last Modified: | 16. Apr 2025 12:39 |
Repository Staff Only: item control page