Zu Hauptinhalt springen
Gewählte Sprache ist Deutsch Select language
Startseite UR

Datenqualitätsmessung und -maßnahmen bei unstrukturierten Daten

 

Logo Datenqualit _t Klein

  

Grundlage für die Entwicklung datengetriebener Dienstleistungen

 

Start:

Juni 2015

Ende:

Juni 2018

Projektlaufzeit:

3 Jahre

Projektförderung:

Bayerisches Staatsministerium für Wirtschaft und Medien, Energie und Technologie

Kooperationspartner:

xapio GmbH, München

Projektleiter:

Prof. Dr. Bernd Heinrich

Prof. Dr. Mathias Klier

 

Aufgrund schnell wachsender Mengen an unstrukturierten Daten ist Datenqualität ein hoch relevantes Thema. So werden bspw. große Mengen an unstrukturierten Daten aus unterschiedlichen, verteilten Quellen in diversen Formaten gesammelt und analysiert (oft in Echtzeit) um geschäftsrelevante Erkenntnisse abzuleiten, unternehmerische Entscheidungen zu unterstützen und datengetriebene Dienstleistungen zu entwickeln. Damit die abgeleiteten Ergebnisse valide und wertstiftend sind ist die Sicherstellung der Qualität der zugrundeliegenden Daten unabdingbar.

Obwohl der Sicherstellung der Qualität von Daten eine so zentrale Bedeutung beizumessen ist, haben viele Unternehmen enormen Nachholbedarf bei der Messung, Steuerung und Verbesserung der Datenqualität. Aktuelle Studien betonen, dass dem Thema Datenqualität unstrukturierter und verteilter Datenmengen eine äußerst hohe Priorität zukommt. Ist keine ausreichende Datenqualität gegeben, resultieren fehlerhafte Erkenntnisse, die zu falschen Entscheidungen führen und mehr Schaden anrichten als Nutzen generieren. Die Projektergebnisse sollen dabei neben Wissenschaft und Praxis insbesondere auch in die Universitätslehre eingehen. Auf diese Weise können Studierende ebenso zeitnah vom intensiven Transfer von Wissen und Technologien im Bereich Datenqualität profitieren.

Konkret sollen im Rahmen des Projekts quantitative Methoden zur Messung, Steuerung und Verbesserung der Datenqualität entwickelt und vor allem anhand konkreter Anwendungsszenarien evaluiert werden. Um dennoch die Allgemeingültigkeit der Projektergebnisse sicherzustellen sowie die breiten Einsatzmöglichkeiten und den Nutzen dieser Ergebnisse zu demonstrieren, werden mit Personalmanagement und Social Customer Relationship Management verschiedene Szenarien mit unterschiedlichen Anforderungen fokussiert. Mit diesen Szenarien sind die Einsatzmöglichkeiten für Unternehmen verschiedener Industrien und Branchen unmittelbar ersichtlich und gegeben. Das Ziel des Vorhabens lässt sich wie folgt zusammenfassen:

Entwicklung von Methoden zur Messung der Datenqualität unstrukturierter Daten und Berücksichtigung der gemessenen Datenqualität in Entscheidungen:

Es werden effiziente quantitative Methoden zur Messung der Datenqualität für datenwertorientierte Qualitätsdimensionen (bspw. Korrektheit, Konsistenz, Aktualität, Vollständigkeit, Eindeutigkeit) entwickelt. Diese sollen aufgrund der zum Teil enormen Datenmengen automatisiert anwendbar und für unterschiedliche unstrukturierte Datenformate sowie verteilte Daten (z. B. unternehmensinterne und -externe Daten) geeignet sein. Zudem sollen zur Analyse unstrukturierter Daten ausgewählte Methoden der Business Intelligence (z. B. Data-Mining- und Text Mining-Verfahren) (weiter)entwickelt werden, um das gemessene Datenqualitätsniveau direkt zu berücksichtigen. Damit wird die Güte der Ergebnisse abhängig von der Qualität der Inputdaten ermittelt und ausgewiesen, um Entscheidungen wesentlich besser als bisher unterstützen zu können. Zugleich ist dies auch die Voraussetzung für die Entwicklung datengetriebener Dienstleistungen, wie bspw. eine hochgradig kontext- und nutzerbezogene Individualisierung angebotener Produkte.

Für die Zielsetzung existieren derzeit noch keine geeigneten Methoden, die zugleich wissenschaftlich fundiert als auch praxistauglich sind. Die erwarteten Ergebnisse haben daher weitreichende wissenschaftliche und wirtschaftliche Implikationen: Die Berücksichtigung der Datenqualität bei BI-Methoden führt zu zuverlässigeren Analyseergebnissen und einer verbesserten Entscheidungsqualität. Konkret lassen sich Fehlentscheidungen mit hohen (ökonomischen) Schäden vermeiden und neuartige datengetriebene Dienstleistungen entwickeln. Die Messung der Datenqualität unstrukturierter Daten ist dabei unabdingbare Voraussetzung.

  1. STARTSEITE UR
  2. Fakultät für Wirtschaftswissenschaften

Lehrstuhl für Wirtschaftsinformatik II

 

Prof. Dr. Bernd Heinrich

 

 

 

 

Team Rechts
Sekretariat

Tel.: +49 (0)941 943-6101
Fax:  +49 (0)941 943-6120
E-Mail
Universitätsstraße 31
93053 Regensburg