Zu Hauptinhalt springen

Regensburger Korpora

Kroatisch diachron (CroDi)

Das Regensburger diachrone Korpus der kroatischen Sprache – CroDi

Das Regensburger diachrone Korpus der kroatischen Sprache CroDi bildet die Materialgrundlage eines von der Deutschen Forschungsgemeinschaft geförderten Projekts „Subjekte II“ (HA 2659/1-2) und wurde im Rahmen dieses Projekts kodiert und am Institut für Slawistik der Universität Regensburg in Zusammenarbeit mit dem Institut für die kroatische Sprache und Linguistik in Zagreb weiter ausgebaut.

CroDi enthält bisher Texte des 16.-19. Jh. in allen Ausprägungen des Kroatischen (Štokavisch, Čakavisch und Kajkavisch), die teilweise mit morphosyntaktischen Kategorien annotiert sind. Neben den bedeutenden Vertretern der kroatischen Literatur dieser Zeit sind auch weniger bekannte Autoren und anonyme Texte vertreten. Die Texte sind zum Teil von Hand annotiert. Die Prinzipien dazu wurden von Roland Meyer, Björn Hansen und Veronika Wald festgelegt und sind ausführlich in dem Artikel „Das Regensburger diachrone Korpus der kroatischen Sprache – CroDi“ (in hrčak) dargestellt.

Das Korpus CroDi ist mit den Zugangsdaten „croco“ (Username) und „crocordi“ (Passwort) online zugänglich:

zur Startseite von CroDi (Link 1)

zur Startseite von CroDi (Link 2)

Team:

Roland Meyer
Ernst Hansack
Björn Hansen
Marijana Horvat
Sanja Perić Gavrančić
Veronika Wald

-->


Russisch diachron (RRuDi)

Das Regensburger russische diachrone Korpus (RRuDi) bildet die Materialgrundlage eines von der Deutschen Forschungsgemeinschaft geförderten Projekts zur historischen Entwicklung der nicht-kanonischen Subjektausdrücke in slavischen Sprachen und wurde u.a. im Rahmen dieses Projekts kodiert und weiter ausgebaut. Das Korpus ist online öffentlich zugänglich und umfasst viele wichtige Textzeugen zur Geschichte des Russischen bzw. Alt- und Mittelostslavischen bis zum Ende des 18. Jahrhunderts. Sie sind teilweise mit morphosyntaktischen Kategorien annotiert und lemmatisiert.

zur Startseite von RRuDi 


Polnisch diachron (PolDi)

Das Regensburger polnische diachrone Korpus (PolDi) wurde in einem von der Deutschen Forschungsgemeinschaft geförderten Projekt zur Entwicklung von peripheren Subjektausdrücken in slavischen Sprachen kompiliert und online verfügbar gemacht. Es speist sich u.a. aus Digitalisierungen, die von einer Gruppe um Gerd Hentschel an der Universität Göttingen erstellt wurden, und aus elektronischen Ausgaben des Instituts für polnische Sprache der Akademie der Wissenschaften in Krakau. Das Korpus ist öffentlich zugänglich. Es wurde orthographisch vereinheitlicht und experimentell mit einem Tagger für das moderne Polnische annotiert und lemmatisiert. 

zur Startseite von PolDi


Parallelkorpus (ParaSol)

ParaSol (PARAllel corpus of Slavic and Other Languages) ist ein aligniertes Parallelkorpus aus übersetzten modernen belletristischen Texten in slavischen und einigen anderen Sprachen. Zunächst gegründet als Regensburg Parallel Corpus (RPC), wird es heute als Kooperationsprojekt zwischen den slavistischen Instituten der Universität Bern und der Universität Regensburg weitergeführt. Es umfasst gegenwärtig (Juli 2011) mehr als 25 Mio. Tokens in 32 Sprachen, wobei 5 Texte in mehr als 12 Sprachen vorliegen. Das Korpus ist morphosyntaktisch annotiert und online abfragbar.

zur Startseite von ParaSol 


Yiddish (CMY)

...The Corpus of Modern Yiddish is still under construction, but online accessible. 

Please contact Sandra Birzer (Sandra.Birzer[at]sprachlit.uni-regensburg.de) for further information.

What the Corpus of Modern Yiddish is about: 1/2

  

Team:

Nikita Bezrukov 
Sandra Birzer
Michael Daniel
Motl Gordon
Björn Hansen
Denis Kirjanov
Małgorzata Jacobs-Kozyra
Mikhail Kudinov
Holger Nath
Elena Luchina
Tatiana Panova
Alexei Poljakov
Vladimir Plungian
Alexandra Poljan
Evita Wiecki
Janina Wurbs

Corpus linguistic advisor:

Roland Meyer

            

The CMY team thanks:

≈ Bibliothèque Medem-Maison de la Culture Yiddish 
≈ Russian Academy of Sciences

    for financial support (Programme "Corpus Linguistics")

≈ Fritz-Thyssen-Foundation
    for financial support (grant number 10.09.1.065)

≈ Binyumen Shekhter Foundation for the Advancement of Yiddish
    for financial support

≈ National Yiddish Book Center 
    for allowing to incorporate texts from their online library

≈ Rachel Heuberger
    (from the Judaica Collection of the University Library Frankfurt / Main)
    for allowing to incorporate texts from their online library

≈ Raphael Finkel 
    for help with OCRing texts

≈ Forverts 
    for allowing to incorporate texts from their website

≈ Lebns-fragn 
    for allowing to incorporate texts from their website

≈ Hamaspik Gazette
    for allowing to incorporate texts from their website

≈ Afn shvel 

    for allowing to incorporate texts from their website 


Bilingualkorpus (ReBiSlav)

Das Regensburger Korpus slavisch-deutscher Bilingualer ist aus mehreren Hauptseminaren mit Übung (Hansen/Meyer) sowie einer Magisterarbeit (Grillborzer) hervorgegangen. Es umfasst Interviews mit slavisch-deutschen Zweisprachigen unterschiedlicher Niveaus, welche die Studierenden selbst erhoben und transkribiert haben. Die Texte wurden für verschiedene linguistische Auffälligkeiten (Code switching etc.) kodiert sowie morphosyntaktisch annotiert. Das online abfragbare Korpus soll laufend erweitert werden.    

zur Startseite von ReBiSlav



  1. Startseite UR

Institut für Slavistik

Universität Regensburg Universitätsstraße 31       

D-93053 Regensburg

Img 0027

Geschäftsführung

Prof. Dr. Sabine Koller

Geschäftsführendes Sekretariat: Lada Hostinsky

Gebäude PT, Zi. 3.3.07
Telefon 0941 943-3362