Datenbereinigung Einkauf
Datenbereinigung Einkauf
Datenbereinigung im Einkauf ist der systematische Prozess, mit dem Lieferanten-, Material- und Konditionsstammdaten von Dubletten, Inkonsistenzen, Tippfehlern und Karteileichen befreit werden. Bei einer Erstinitiative liegen die identifizierten Dublettenraten typischerweise zwischen 20 und 40 % des Stamms — was nicht an mangelnder Disziplin liegt, sondern an Konzernfusionen, ERP-Migrationen und der Tatsache, dass jeder Disponent sich seit 2003 seine eigenen Lieferanten anlegt.
Detaillierte Erklärung
Datenbereinigung gliedert sich nach DAMA-DMBOK (2. Auflage, 2017) in fünf Phasen: Profiling (Ist-Analyse mit Tools wie Talend Data Quality, Ataccama oder Informatica IDMC), Standardisierung (USt-IdNr.-Format, Adressparsing nach DIN 5008, Telefonnummern in E.164), Dublettenerkennung (siehe [[dublettenerkennung]] und [[match-merge-regeln]]), Korrektur und Anreicherung (DUNS-Nummer-Lookup über Bisnode, Branchencode über D&B oder Creditreform) sowie Validierung. Tacto und der Bundesverband Materialwirtschaft, Einkauf und Logistik (BME) beobachten in DACH-Mittelstandsprojekten Bereinigungsquoten von 20–40 %; ein dokumentierter Automotive-Fall zeigt 15.000 Dubletten in einem Stamm von 50.000 Datensätzen, also 30 %. The Hackett Group dokumentiert in der "Digital World Class Procurement"-Studie 2025, dass Spitzenorganisationen ihre Beschaffung 21 % günstiger betreiben — ein wesentlicher Hebel ist die Datenqualität, die Voraussetzung für die in derselben Studie ausgewiesene 32 % geringere Personaldecke ist. Methodisch unterscheidet die Branche zwischen Initial-Cleansing (einmalig, projektgetrieben, Dauer typischerweise 6–12 Monate) und Continuous Cleansing (kontinuierlich, prozessintegriert, betrieben von [[data-steward]] und [[datenowner]]). Die ISO 8000-Reihe definiert die Qualitätsanforderungen, ISO/IEC 25012 das zugrundeliegende Datenqualitätsmodell mit den Dimensionen Vollständigkeit, Genauigkeit, Konsistenz, Aktualität, Glaubwürdigkeit und Zugänglichkeit. Eine Datenbereinigung ohne anschließendes [[master-data-governance]] ist erfahrungsgemäß nach 24–36 Monaten zurück auf Ausgangsniveau — der Pflegeaufwand ist nicht das Problem, sondern die fehlende Eigentumsklärung.
Praxisbeispiel (konkretes Einkaufsszenario)
Ein Werkzeughersteller aus Nordrhein-Westfalen mit 680 Mitarbeitenden und 94 Mio. Euro Beschaffungsvolumen startet 2025 nach einer SAP-S/4HANA-Migration eine Bereinigungsinitiative. Ausgangslage: 8.420 Lieferantenstammsätze, davon 3.180 ohne Buchung in den letzten 36 Monaten und 2.140 mit unvollständigen Pflichtfeldern (DUNS, Bankverbindung, IBAN-Prüfziffer fehlerhaft). Profiling mit Ataccama identifiziert 1.870 Dubletten-Cluster mit insgesamt 4.310 Datensätzen — Bereinigungsquote 32,8 %. Die Standardisierung der Adressfelder nach DIN 5008 deckt zusätzlich 312 fehlerhafte Hausnummern auf. Nach acht Monaten Projektlaufzeit umfasst der aktive Stamm 4.180 unique Lieferanten, die Vollständigkeitsquote der Pflichtattribute steigt von 67 % auf 96 %, die Klassifizierungsquote auf eCl@ss-Level-4 von 38 % auf 91 %. Konkrete Effekte: Die Spend-Analyse identifiziert 1,4 Mio. Euro Bündelungspotenzial bei zuvor zersplitterten Konzernlieferanten, die Sanktionslistenprüfung nach AWG §18 läuft erstmals vollautomatisch durch (vorher 8 % manuelle Nacharbeit), und die Bestellbearbeitungszeit sinkt um 22 % weil Disponenten nicht mehr zwischen vier Stammsätzen desselben Anbieters auswählen müssen.
Typische Fehler & Verhandlungskontext
Erstens Big-Bang-Bereinigung ohne Pflegeprozess: Nach 18 Monaten ist die Dublettenrate zurück auf Ausgangsniveau, weil Eingangskanäle (Kreditorenbuchhaltung, Drittanbieter-Portale, Maverick-Bestellungen) ungefiltert in den Stamm einlaufen. Zweitens Bereinigung ohne fachliche Owner-Klärung: Wenn Einkauf und Buchhaltung sich nicht einigen, wer den Lieferanten besitzt, blockieren beide die finale Konsolidierung — ein typischer Fall, der durch klare RACI-Definition (siehe [[datenowner]]) gelöst wird. Drittens Vernachlässigung der Compliance-Auswirkungen: Eine veraltete Adresse kann nach §8 GwG (Geldwäschegesetz) zu meldepflichtigen Verstößen führen, eine doppelt geführte Sanktionsliste-relevante Entität verstößt gegen die EU-Verordnung 833/2014. Im Verhandlungskontext gilt: Bündelungs-Argumente in Jahresgesprächen funktionieren nur mit konsolidiertem Stamm — wer im Gespräch mit der Würth-Gruppe vier Stammsätze parallel pflegt und 480.000 Euro Volumen vorrechnet, von denen 180.000 Euro auf einer veralteten Tochter liegen, verliert sofort an Glaubwürdigkeit. Datenbereinigung ist damit kein IT-Projekt, sondern unmittelbar ergebnisrelevant.
Verwandte Begriffe
[[stammdatenmanagement-mdm]], [[datenqualitaet-einkauf]], [[data-governance-einkauf]], [[dublettenerkennung]], [[datenmodell-einkauf]], [[datenkatalog-einkauf]], [[etl-prozess-einkauf]], [[data-steward]], [[klassifizierungsquote]], [[golden-record]], [[match-merge-regeln]], [[master-data-governance]], [[datenowner]], [[datenqualitaetsbericht]]