Zu Hauptinhalt springen

AP12: Crosskonkordanzen von Klassifikationen und Thesauri

Gesamtziel

Ausgangssituation:

In Bibliotheken und Fachinformationssystemen werden unterschiedliche Klassifikationen und Thesauri verwendet. Dadurch ist die fach- und datenbankübergreifende Suche sehr erschwert. Der Benutzer, der z.B. zuerst in einem Bibliothekskatalog in Regensburg sucht, danach in einem aus Niedersachsen oder der USA und anschließend unselbständige Literatur aus der Literaturdatenbank einer Informationsservicestelle, muß jeweils mit anderen Suchbegriffen und einer eigenen Suchlogik arbeiten, wodurch eine effiziente Suche kaum möglich ist. In der Regel kennt der Benutzer nur die Klassifikation bzw. den Thesaurus, mit der/bzw. mit dem er vorrangig arbeitet. Dieses Problem verschärft sich, wenn die verschiedenen Bibliothekskataloge und Literaturdatenbanken technologisch so verbunden werden, daß der Benutzer auf sie mit einer einheitlichen Suchmaske zugreifen kann. Dies gilt auch für die Verwendung unterschiedlicher Erschließungssysteme in Metadaten.

Ziel ist eine integrierte Suche nach sachlichen Gesichtspunkten in verteilten Datenbeständen mit unterschiedlichen inhaltlichen Schwerpunkten zu ermöglichen. Dabei soll den begrifflichen Unterschieden der verwendeten Thesauri und Klassifikationen durch Crosskonkordanzen Rechnung getragen werden.

Zur Erreichung des Gesamtziels ist erforderlich:

  • Die Untersuchung der Methodik von Crosskonkordanzen zwischen Klassifikationen bzw. Thesauri.
  • Die Programmierung eines Verfahrens, wie solche Crosskonkordanzen zwischen unterschiedlichen im Internet verfügbaren Klassifikationen bzw. Thesauri abgebildet werden können.
  • Die prototypische Erarbeitung solcher Crosskonkordanzen für bestimmte Fachgebiete und ausgewählte Klassifikationen bzw. Thesauri.

Als fachliche Basis werden entsprechend dem Schwerpunkt von CARMEN Mathematik und Physik ausgewählt. Aus methodischen Gründen wird der fachliche Rahmen jedoch auf die Sozialwissenschaften ausgedehnt.

Eine parallele Vorgehensweise bei Klassifikationen und Thesauri ermöglicht es, Erkenntnisse über die gemeinsamen bzw. abweichenden Probleme und Lösungsmethoden verschiedener Erschließungsverfahren und Fachgebiete zu gewinnen. Dies stellt den prototypischen Charakter der Untersuchung sicher. Die Lösungen sollen auch auf andere, nicht in die Untersuchung einbezogene Klassifikationen und Thesauri übertragen werden können.

Arbeitsziele und Produkte des Arbeitspakets

Gemeinsam für beide Unterbereiche Klassifikation und Thesaurus ist die Klärung methodischer Fragen.

  •  Die Crosskonkordanzen verweisen auf Klassifikationen/Thesauri, die in sich geschlossene Systeme darstellen. Zwischen verschiedenen Klassifikationen/Thesauri muss mit Hilfe der Crosskonkordanz navigiert werden können.
  • Die Art der Beziehung zwischen einander zugeordneten Notationen/Deskriptoren muss abgebildet werden; z.B.:
    • Beziehung 1 : 1 (Synonyme Begriffe, parallele Notationen);
    • Oberbegriff : Unterbegriff ;
    • Unterbegriff : Oberbegriff;
    • Verwandte Begriffe;
    • Maß für die Übereinstimmung usw.
  • Diese Beziehungen werden im Arbeitspaket 7 (Retrieval), 9 (fachübergreifendes Informationssystem) und 11 (Heterogenitätsbehandlung) ausgewertet.
  • Die Crosskonkordanzen greifen teils auf lokal, teils auf dezentral gehaltene vernetzte Datenbestände (Klassifikationen/Thesauri) zu. Das Update der jeweiligen Klassifikationen bzw.Thesauri erfolgt dabei durch die jeweilige zuständige Institution, z.B. die American Mathematical Society, OCLC usw. Das dann erforderliche Update der Crosskonkordanzen übernehmen die UB Regensburg bzw. Die Deutsche Bibliothek. Dabei ist die Kompatibilität der zu entwickelnden Softwareprodukte zu beachten.

Programmierung

Die Programmierung der Crosskonkordanzen erfolgt in JAVA auf der Basis eines relationalen Datenbanksystems mit abstrakter Zwischenebene, die den Übergang zu verschiedenen Herstellern von Datenbanksoftware erlaubt. Es wird mit dem Verfahren des rapid prototyping gearbeitet. Für die Unterbereiche Klassifikation und Thesaurus wird ein gemeinsames Softwaretool erarbeitet.

Im Bereich Klassifikation besteht die Programmierung aus zwei Teilen. Aufbauend auf dem Projekt RVK-Online wird ein System zur Datenhaltung, strukturierten Suche und benutzerfreundlichen Präsentation von Klassifikationen entwickelt. Mit diesem Tool sollen prinzipiell beliebige Klassifikationen abgebildet werden können. Konkret wird dies für RVK und DDC realisiert.

Daneben wird die Crosskonkordanz entwickelt, die auf diese beiden bzw. außenstehende Klassifikationen (MSC, PACS und die Klassifikation Sozialwissenschaften) verweist.

Angestrebt ist genau auf die jeweils benutzte Stelle einer Klassifikation zu verweisen, nicht nur auf die Klassifikation insgesamt. Anzustreben ist diese Funktionalität auch bei der Verwendung von Metadaten.

Offen ist noch, ob sich diese verteilte Struktur, die organisatorische Vorteile hat, bewähren wird, oder ob sich ein anderes Strukturmodell als günstiger erweist. Hierzu wird von den Erfahrungen aus dem Projekt ELVIRA (cf. AP11) und den Vorarbeiten von Regensburg ausgegangen.

Die Ergebnisse müssen visualisiert werden, sowohl in der punktuellen Recherche als auch in der Navigation und der Abbildung der Struktur der Klassifikation/des Thesaurus. Hierbei ist insbesondere für die Klassifikation größerer Entwicklungsaufwand erforderlich. In der SWD sind Teile der Funktionen schon realisiert.

Unterbereich Klassifikation:

Die Methoden einer Konkordanz zwischen Allgemeinklassifikationen und Fachklassifikationen sollen beispielhaft erarbeitet werden. Dafür erscheinen besonders geeignet: DDC und RVK in den Fächern Mathematik und Physik sowie MSC und PACS.

Ergänzend wird für die Klassifikation Sozialwissenschaften eine Konkordanz zur RVK und DDC geschaffen.

Die Probleme liegen dabei sowohl bei den fachlichen Überschneidungen der Fachklassifikationen (MSC, PACS), als auch zwischen den stark spezialisierten Fachklassifikationen und den Allgemeinklassifikationen (z.B. MSC-DDC). Im Projekt wird geklärt, ob eine einzelne Klassifikation die Basis bildet, auf die die anderen Klassifikationen abgebildet werden, oder ob jede Klassifikation auf alle anderen abgebildet wird. Ebenso ist zu klären, wie eine strukturierte Suche in Begriffsbäumen unterschiedlicher paralleler Klassifikationen realisiert werden kann.

Neben der Suche in der Klassifikation nach Notationen und der hierarchischen Struktur muss eine verbale Suche möglich sein. Anzustreben ist eine zweisprachige Suche in allen Klassifikationen.

Organisationsform

Der Prototyp der Crosskonkordanz von Klassifikationen wird an der Universität Regensburg programmiert und über AP 11 und AP 7 in CARMEN integriert. Er kann später in Bibliothekssysteme integriert werden und zudem als Stand-alone-System von Fachinformationszentren und Verlagen verwendet werden. Die Konkordanz der Klassifikationen wird in Regensburg erarbeitet, wobei mit OCLC kooperiert wird. OCLC ist ein außenstehender Partner.

Die Konkordanz von Thesauri wird kooperativ von Der Deutschen Bibliothek Frankfurt und dem IZ erarbeitet. Dabei wird mit dem DIPF und dem Max-Planck-Institut für Bildungsforschung kooperiert.

Der Verlag Leske und Budrich wird für die Sozialwissenschaften in beratender Funktion tätig, um die Anwendbarkeit in einem Verlag zu sichern.

Außerhalb der Sonderfördermaßnahme CARMEN wird kooperiert mit den Anträgen der Fachhochschule Regensburg und des Leske und Budrich-Verlags in Slot 1.

Im Hinblick darauf, daß mit der DDC und der SWD Produkte eingesetzt werden, die gegen Lizenzgebühr vertrieben werden, müssen später Abrechnungsmodule des Global-Info-Programms genutzt werden.

Verwertungsplan

Bei der Software handelt es sich um Produkte, die für unterschiedliche Klassifikationen und Thesauri verwendet werden können und kostenfrei bereitstehen. An solchen Produkten besteht großer Bedarf. Bei den erarbeiteten Konkordanzen handelt es sich um Prototypen, die von den beteiligten Einrichtungen kostenfrei im Internet bereitgestellt werden. Sie werden von den jeweiligen beteiligten Institutionen weiter gepflegt.

Unterbereich Klassifikation:

Die Klassifikationen RVK und möglicherweise DDC werden dauerhaft bei der Universität Regensburg bereitgestellt werden, ebenso die Konkordanz. Über das Vertriebsrecht der DDC muss für einen realen Produktionsbetrieb ein Vertrag mit OCLC (Forest Press) abgeschlossen werden. Denkbar ist auch, dass eine deutsche Ausgabe DDC später bei Der Deutschen Bibliothek geführt wird.

Unterbereich Thesaurus:

Die Thesauri werden weiterhin bei den jeweiligen beteiligten Institutionen geführt; die vermittelnde Konkordanz ggf. Der DB. Die Verwertungsrechte für die SWD bleiben unberührt.

Kontakt

Dr. Albert Schröder

Universitätsbibliothek Regensburg

93042 Regensburg

E-Mail: albert.schroeder@ur.de

Telefon: 0941 943-3900


  1. Universität

Universitätsbibliothek

Carmen12