Direkt zum Inhalt


Aktuelles: Neue MIS Quarterly-Publikation: Ereignisgetriebener Ansatz zur Erkennung von Datenduplikaten

Wir freuen uns sehr, die Veröffentlichung des Artikels „Different but the Same? An Event-Driven Approach to Determine Probabilities of Data Duplication“ bekanntzugeben, entwickelt am Lehrstuhl für Wirtschaftsinformatik II von Bernd Heinrich und Alexander Schiller. Der Beitrag ist in MIS Quarterly erschienen, einem der weltweit führenden Journals im Bereich Wirtschaftsinformatik (und dem einzigen IS-Journal, das in der interdisziplinären ShanghaiRanking-Liste der Top-Journals geführt wird).
We are excited to announce that the article “Different but the Same? An Event-Driven Approach to Determine Probabilities of Data Duplication”, developed at the Chair of Information Systems II by Bernd Heinrich and Alexander Schiller, has been published in MIS Quarterly, one of the world’s leading journals in Information Systems (and the only IS journal featured in the interdisciplinary ShanghaiRanking list of top journals).

08. Dezember 2025, von Alexander Schiller

  • Informatik und Data Science
  • Forschung

Worum es in der Forschung geht
Datenduplikate stellen weiterhin eine große Herausforderung für Business Analytics und datengetriebene Entscheidungsprozesse dar. Der Artikel führt einen neuen Denkansatz zur Duplikaterkennung ein: Anstatt sich ausschließlich auf Features von Daten und Ähnlichkeiten zu konzentrieren, werden Duplikate auf die zugrunde liegenden Ereignisse zurückgeführt, die sie verursachen. Darauf aufbauend entwickeln wir einen probabilistischen Ansatz, der interpretierbare, entscheidungsrelevante Duplikatswahrscheinlichkeiten liefert.

Warum das wichtig ist
Der Ansatz wurde anhand von sieben Datensätzen aus unterschiedlichen Geschäftskontexten umfassend evaluiert und übertraf etablierte Methoden durchgängig. Fachexpertinnen und Fachexperten bestätigten die hohe praktische Relevanz und die Einsetzbarkeit der resultierenden Wahrscheinlichkeiten, beispielsweise in quantitativen Entscheidungsmodellen. Damit leistet die Studie nicht nur einen Beitrag zur Datenqualitätsforschung, sondern unterstützt insgesamt zuverlässigere, KI-gestützte und perspektivisch automatisierte datenbasierte Entscheidungen in Unternehmen.

Zum vollständigen Artikel
Die Veröffentlichung finden Sie hier:
https://misq.umn.edu/misq/article-abstract/49/4/1539/3232/Different-but-the-Same-An-Event-Driven-Approach-to (externer Link, öffnet neues Fenster)

Wir danken unseren Ko-Autoren Mathias Klier und Andreas Obermeier von der Universität Ulm herzlich für die hervorragende Zusammenarbeit sowie der DFG für die Förderung dieses Forschungsprojekts.

What the research is about
Data duplicates continue to pose serious challenges for business analytics and data-driven decision-making. This paper introduces a new way of thinking about duplicate detection: instead of focusing solely on data features and similarities, it traces duplicates back to the events that cause them. Building on this idea, we develop a probability-based approach that provides interpretable, decision-ready duplicate probabilities.

Why it matters
The approach was rigorously tested on seven datasets across diverse business contexts, consistently outperforming established methods. Domain experts validated its practical relevance, confirming that the resulting probabilities can be seamlessly integrated into, e.g., quantitative decision processes. Beyond advancing data quality research, the study supports more reliable, AI-assisted—and ultimately automated—data-driven decision-making in organizations.

Read the full article
The publication is available here:
https://misq.umn.edu/misq/article-abstract/49/4/1539/3232/Different-but-the-Same-An-Event-Driven-Approach-to (externer Link, öffnet neues Fenster)

We sincerely thank our co-authors Mathias Klier and Andreas Obermeier from Ulm University for their excellent collaboration, as well as the DFG for supporting this research project.

nach oben