Das Regensburger diachrone Korpus der kroatischen Sprache CroDi bildet die Materialgrundlage eines von der Deutschen Forschungsgemeinschaft geförderten Projekts „Subjekte II“ (HA 2659/1-2) und wurde im Rahmen dieses Projekts kodiert und am Institut für Slawistik der Universität Regensburg in Zusammenarbeit mit dem Institut für die kroatische Sprache und Linguistik in Zagreb weiter ausgebaut.
CroDi enthält bisher Texte des 16.-19. Jh. in allen Ausprägungen des Kroatischen (Štokavisch, Čakavisch und Kajkavisch), die teilweise mit morphosyntaktischen Kategorien annotiert sind. Neben den bedeutenden Vertretern der kroatischen Literatur dieser Zeit sind auch weniger bekannte Autoren und anonyme Texte vertreten. Die Texte sind zum Teil von Hand annotiert. Die Prinzipien dazu wurden von Roland Meyer, Björn Hansen und Veronika Wald festgelegt und sind ausführlich in dem Artikel „Das Regensburger diachrone Korpus der kroatischen Sprache – CroDi“ (in hrčak) dargestellt.
Das Korpus CroDi ist mit den Zugangsdaten „croco“ (Username) und „crocordi“ (Passwort) online zugänglich:
zur Startseite von CroDi (Link 1)
zur Startseite von CroDi (Link 2)
Roland Meyer
Ernst Hansack
Björn Hansen
Marijana Horvat
Sanja Perić Gavrančić
Veronika Wald
Das Regensburger russische diachrone Korpus (RRuDi) bildet die Materialgrundlage eines von der Deutschen Forschungsgemeinschaft geförderten Projekts zur historischen Entwicklung der nicht-kanonischen Subjektausdrücke in slavischen Sprachen und wurde u.a. im Rahmen dieses Projekts kodiert und weiter ausgebaut. Das Korpus ist online öffentlich zugänglich und umfasst viele wichtige Textzeugen zur Geschichte des Russischen bzw. Alt- und Mittelostslavischen bis zum Ende des 18. Jahrhunderts. Sie sind teilweise mit morphosyntaktischen Kategorien annotiert und lemmatisiert.
Das Regensburger polnische diachrone Korpus (PolDi) wurde in einem von der Deutschen Forschungsgemeinschaft geförderten Projekt zur Entwicklung von peripheren Subjektausdrücken in slavischen Sprachen kompiliert und online verfügbar gemacht. Es speist sich u.a. aus Digitalisierungen, die von einer Gruppe um Gerd Hentschel an der Universität Göttingen erstellt wurden, und aus elektronischen Ausgaben des Instituts für polnische Sprache der Akademie der Wissenschaften in Krakau. Das Korpus ist öffentlich zugänglich. Es wurde orthographisch vereinheitlicht und experimentell mit einem Tagger für das moderne Polnische annotiert und lemmatisiert.
ParaSol (PARAllel corpus of Slavic and Other Languages) ist ein aligniertes Parallelkorpus aus übersetzten modernen belletristischen Texten in slavischen und einigen anderen Sprachen. Zunächst gegründet als Regensburg Parallel Corpus (RPC), wird es heute als Kooperationsprojekt zwischen den slavistischen Instituten der Universität Bern und der Universität Regensburg weitergeführt. Es umfasst gegenwärtig (Juli 2011) mehr als 25 Mio. Tokens in 32 Sprachen, wobei 5 Texte in mehr als 12 Sprachen vorliegen. Das Korpus ist morphosyntaktisch annotiert und online abfragbar.
...The Corpus of Modern Yiddish is still under construction, but online accessible.
Please contact Sandra Birzer (Sandra.Birzer[at]sprachlit.uni-regensburg.de) for further information.
Nikita Bezrukov
Sandra Birzer
Michael Daniel
Motl Gordon
Björn Hansen
Denis Kirjanov
Małgorzata Jacobs-Kozyra
Mikhail Kudinov
Holger Nath
Elena Luchina
Tatiana Panova
Alexei Poljakov
Vladimir Plungian
Alexandra Poljan
Evita Wiecki
Janina Wurbs
Roland Meyer
≈ Bibliothèque Medem-Maison de la Culture Yiddish
≈ Russian Academy of Sciences
for financial support (Programme "Corpus Linguistics")
≈ Fritz-Thyssen-Foundation
for financial support (grant number 10.09.1.065)
≈ Binyumen Shekhter Foundation for the Advancement of Yiddish
for financial support
≈ National Yiddish Book Center
for allowing to incorporate texts from their online library
≈ Rachel Heuberger
(from the Judaica Collection of the University Library Frankfurt / Main)
for allowing to incorporate texts from their online library
≈ Raphael Finkel
for help with OCRing texts
≈ Forverts
for allowing to incorporate texts from their website
≈ Lebns-fragn
for allowing to incorporate texts from their website
≈ Hamaspik Gazette
for allowing to incorporate texts from their website
≈ Afn shvel
for allowing to incorporate texts from their website
Das Regensburger Korpus slavisch-deutscher Bilingualer ist aus mehreren Hauptseminaren mit Übung (Hansen/Meyer) sowie einer Magisterarbeit (Grillborzer) hervorgegangen. Es umfasst Interviews mit slavisch-deutschen Zweisprachigen unterschiedlicher Niveaus, welche die Studierenden selbst erhoben und transkribiert haben. Die Texte wurden für verschiedene linguistische Auffälligkeiten (Code switching etc.) kodiert sowie morphosyntaktisch annotiert. Das online abfragbare Korpus soll laufend erweitert werden.