Zum Inhalt springen
Procari Lexikon OCR-Rechnungserkennung
Einkaufslexikon

OCR-Rechnungserkennung

OCR-Rechnungserkennung

OCR-Rechnungserkennung wandelt eingescannte Papier- oder Bild-PDF-Rechnungen in maschinenlesbare Felder wie Lieferantennummer, Rechnungsbetrag, Steuerbetrag und Positionsdaten um und ist die Brücke zwischen analogem Belegeingang und einer dunkel verbuchten Buchhaltung.

Detaillierte Erklärung

OCR steht für Optical Character Recognition; spezialisierte Engines wie das quelloffene Tesseract der Google-Community oder kommerzielle Lösungen wie ABBYY FineReader, Klippa und IBM Datacap analysieren ein Pixelbild und ordnen den darin enthaltenen Glyphen Zeichen zu. Bei strukturierten Belegen wie Rechnungen kommt eine zweite Stufe hinzu: Templates oder lernende Modelle erkennen, an welcher Position auf dem Dokument welche Information steht. Tesseract 4 erreicht bei sauberen 300-DPI-Scans zwischen 89 und 94 Prozent Zeichengenauigkeit, ABBYY FineReader trainiert mit FlexiLayouts laut Hersteller 96 bis 98 Prozent, moderne LLM-gestützte Erkenner wie Klippa OCR oder Microsoft Document Intelligence kommen bei strukturierter Extraktion auf bis zu 99,7 Prozent. Rechtlich greift in Deutschland die GoBD in der Fassung des BMF-Schreibens vom 11. März 2024: Werden Rechnungsdaten per OCR ausgewertet, müssen die extrahierten Felder geprüft, gegebenenfalls korrigiert und gemeinsam mit dem Originalbeleg über die zehnjährige Aufbewahrungsfrist gespeichert werden. Damit grenzt sich OCR klar von einer echten [[xrechnung]] ab, die schon strukturiert eintrifft und keine Erkennung mehr braucht. Das Bundesamt für Sicherheit in der Informationstechnik (BSI) empfiehlt für die Eingangsverarbeitung den Einsatz nach BSI IT-Grundschutz APP.6 (Allgemeine Software) inklusive Vier-Augen-Prinzip bei Beträgen über einer freigabepflichtigen Schwelle. Aktuelle Lösungen verbinden die klassische OCR-Engine mit nachgelagerten Sprachmodellen, die Felder kontextuell zuordnen und so auch unstrukturierte Lieferantenangaben wie Bestellnummern in Freitextzeilen erkennen.

Praxisbeispiel (konkretes Einkaufsszenario)

Ein Anlagenbauer mit 380 Mitarbeitenden empfängt 38.500 Eingangsrechnungen pro Jahr von 2.140 Lieferanten, davon 62 Prozent als PDF per E-Mail, 11 Prozent als Papier und 27 Prozent bereits als ZUGFeRD oder XRechnung. Vor der Einführung einer OCR-gestützten Erkennung lag die Erstdurchlaufzeit bei 6,3 Tagen, die Skontoquote bei 41 Prozent und die manuelle Erfassung beanspruchte 2,1 Vollzeitstellen in der Kreditorenbuchhaltung. Nach Einführung von ABBYY FlexiCapture mit angeschlossenem [[rpa-im-einkauf]]-Bot für den 3-Wege-Abgleich gegen Bestellung und Wareneingang sanken die Kennzahlen wie folgt: Durchlaufzeit auf 1,7 Tage, manueller Aufwand auf 0,4 Vollzeitstellen, Skontoquote auf 79 Prozent. Die Erkennungsrate für die Kopfdaten lag bei 96,3 Prozent, für die Positionszeilen bei 88,1 Prozent; alle Belege unterhalb der 88-Prozent-Konfidenz wurden in eine Validierungs-Queue geleitet, die im Schnitt 41 Sekunden pro Beleg beanspruchte. Die Investition von 218.000 EUR amortisierte sich nach 14 Monaten.

Typische Fehler & Verhandlungskontext

Häufigster Fehler ist die Behandlung der OCR-Ergebnisse als verifizierte Daten ohne Konfidenzschwelle, wodurch Fehlbuchungen unentdeckt in die Kreditorenstammdaten einsickern; Standard ist ein Schwellwert von mindestens 95 Prozent für Kopfdaten und 90 Prozent für Positionsdaten, bei Unterschreitung Vier-Augen-Prüfung. Zweitens vernachlässigen Unternehmen das GoBD-konforme Versionieren: Sowohl der Originalbeleg als auch das korrigierte Datenfeld müssen archiviert werden, sonst droht eine Verwerfung der Buchführung durch die Finanzverwaltung. In Lieferantengesprächen lohnt es sich, den Wechsel zu [[xrechnung]] oder [[zugferd]] gegen verlängerte Skontofristen einzutauschen, weil OCR damit ganz entfällt. Drittens unterschätzen Anwender die Wartung von Vorlagen: Jede Layoutänderung des Lieferanten kann die Trefferquote für Positionsdaten um 10 bis 25 Prozentpunkte reduzieren, weshalb ein Monitoring der Konfidenzwerte pro Kreditor und Quartal empfehlenswert ist.

Verwandte Begriffe

OCR-Rechnungserkennung schlägt die Brücke zwischen Papierprozessen und [[xrechnung]] bzw. [[zugferd]], speist Daten in [[rpa-im-einkauf]]-Bots ein, ist Voraussetzung für eine vollständige [[spend-analyse]] und greift mit der GoBD-konformen Archivierung in [[supply-chain-management]]-Prozesse hinein.

Alle 1.460+ Begriffe als PDF

Das komplette Procari Einkaufslexikon — kostenlos per Email.

PDF anfordern →