Golden Record
Golden Record
Der Golden Record ist die kanonische, abgestimmte Version eines Datenobjekts — im Einkauf meist Lieferant, Material oder Vertrag — die aus mehreren Quellsystemen durch [[match-merge-regeln]] und Überlebensregeln zusammengeführt wurde. Er ist das Output des [[stammdatenmanagement-mdm]] und die einzige Wahrheit, gegen die alle nachgelagerten Prozesse arbeiten: Bestellung, Bonitätsprüfung, Risikobewertung, Auditierung.
Detaillierte Erklärung
Der Begriff stammt aus dem MDM-Umfeld der frühen 2000er Jahre und wurde durch das DAMA-DMBOK 2 (Data Management Body of Knowledge, Data Management Association International, 2. Auflage 2017) als formale Konstruktion etabliert. Konkret entsteht der Golden Record in einem dreistufigen Prozess: erstens Match über deterministische Schlüssel (DUNS-Nummer, USt-IdNr., Steuernummer) oder probabilistische Algorithmen (Fuzzy-Matching mit Jaro-Winkler-, Levenshtein- oder Cosine-Similarity-Distanz, Schwellwerte typisch 0,87 bis 0,94); zweitens Merge über Survivorship Rules, die je Feld festlegen, welche Quelle gewinnt (Beispiel: "USt-IdNr. aus SAP, Adresse aus Coupa, Bonitätsscore aus Creditreform"); drittens Persist als Master-Datensatz mit Verweis-Tabelle auf alle ursprünglichen Quell-IDs (Cross-Reference-Map).
Marktführende MDM-Plattformen sind Informatica MDM (Marktführer im Gartner Magic Quadrant Master Data Management Solutions, Ausgaben 2024 und 2025; Informatica gegründet 1993 in Redwood City), Reltio (gegründet 2011 in Redwood Shores von Manish Sood, Bewertung 1,7 Milliarden US-Dollar nach Series-D 2022) und SAP Master Data Governance als ERP-nahe Variante. Open-Source-Ansätze wie Apache Atlas und Pimcore sind im Mittelstand verbreitet. Survivorship-Strategien laut Reltio-Whitepaper 2025 in vier Kategorien: Source Priority (Quellsystem-Hierarchie), Most Recent (jüngster Zeitstempel gewinnt), Most Complete (vollständigster Datensatz gewinnt), Custom Rule (Logik je Feld). In der Praxis kombinieren reife MDM-Setups alle vier auf Feldebene; eine typische Survivorship-Konfiguration für einen Lieferanten-Golden-Record umfasst 24 bis 38 Felder mit individuellen Regeln. Hackett Benchmark 2025: Weltklasse-Organisationen pflegen rund 78 Prozent ihrer kritischen Lieferanten als Golden Records, gegenüber 31 Prozent im Branchendurchschnitt; der Pflegeaufwand liegt bei rund 4 bis 7 Minuten pro Datensatz pro Jahr durch [[data-steward]]-Eingriffe.
Praxisbeispiel (konkretes Einkaufsszenario)
Ein baden-württembergischer Werkzeughersteller (2.480 Mitarbeitende, 510 Mio. EUR Beschaffungsvolumen, drei Werke, eine Vertriebs-GmbH in Polen) konsolidiert 2026 vier Lieferanten-Quellsysteme — SAP S/4HANA Werk Stuttgart, SAP ECC Werk Pforzheim, Microsoft Dynamics 365 Polen, Coupa für Indirect Spend — auf Reltio MDM. Ausgangslage: 24.180 Lieferantendatensätze in den vier Quellen, geschätzte Dublettenrate 27 Prozent. Match-Phase: deterministischer Match über USt-IdNr. und DUNS-Nummer löst 62 Prozent der Dubletten, probabilistischer Match auf Adress- und Namens-Ähnlichkeit (Jaro-Winkler-Schwellwert 0,91) weitere 24 Prozent, Rest manuell durch zwei [[data-steward]] auf 14 Wochen verteilt. Merge-Phase: 38 Felder mit individuellen Survivorship Rules, zum Beispiel Adresse aus dem Quellsystem mit jüngstem Update-Zeitstempel, Bonitätsscore aus Creditreform-Anbindung (Creditreform gegründet 1879 in Mainz), USt-IdNr. aus SAP S/4HANA als führend. Ergebnis: 17.620 Golden Records (entspricht 27 Prozent Bereinigungsquote). Cross-Reference-Map verbindet jeden Golden Record mit durchschnittlich 1,37 Quell-IDs. Lizenz Reltio 218.000 EUR pro Jahr, Implementierung 940.000 EUR über 17 Monate. Effekt: Erstmalig konzernweite Lieferanten-Risikobewertung möglich, identifiziertes Konsolidierungspotenzial 6,8 Mio. EUR im ersten Jahr nach Go-Live, Audit nach DIN EN ISO 9001:2015 ohne Stammdaten-Findings bestanden.
Typische Fehler & Verhandlungskontext
Erstens werden Survivorship Rules oft nicht vom Fachbereich definiert, sondern von der IT mit Default-Werten — Folge: technisch korrekter, fachlich falscher Golden Record. Zweitens fehlt die Cross-Reference-Map: Wenn der Bezug zwischen Golden Record und Quell-IDs verloren geht, lassen sich Korrekturen nicht zurückführen, und nachgelagerte Bestellungen knüpfen weiter an die alten Quell-IDs an — Datendrift. Drittens unterschätzen Organisationen den kontinuierlichen Pflegeaufwand: Forrester-Wave-Analyse MDM 2024 zeigt, dass 41 Prozent aller MDM-Implementierungen nach 18 Monaten unter 70 Prozent Aktualität fallen, weil neue Quellen hinzukommen, ohne in das Match-Merge eingebunden zu werden. In Verhandlungen mit MDM-Anbietern ist die offene API für Survivorship Rules das härteste Kriterium — proprietäre Regel-Engines verursachen Vendor-Lock-in und kosten bei Wechsel typisch 380.000 bis 720.000 EUR Reimplementierung.
Verwandte Begriffe
Der Golden Record ist das Output von [[stammdatenmanagement-mdm]] und [[master-data-governance]], entsteht durch [[match-merge-regeln]] und [[dublettenerkennung]], wird durch einen [[data-steward]] kontinuierlich gepflegt und ist Voraussetzung für saubere [[datenbereinigung-einkauf]] sowie aussagekräftige [[datenqualitaet-einkauf]] insgesamt.