edit_square igindin

Docuvera: AI-Dokumente, die Entscheidungen treffen — keine Extraktionen

AI-Dokumentenplattform jenseits von OCR — domänentrainierte Modelle für unstrukturierte Dokumente.

Ilya Gindin
translate en  · es  · fr  · pt-br  · ru
ilao dzindin version lesen arrow_forward

Es gibt einen Moment, den jedes dokumentenintensive Unternehmen kennt. Jemand lädt ein PDF hoch, schickt es durch ein OCR-Tool, bekommt eine Textwand zurück und dann… was nun?

Das Tool hat seinen Job gemacht. Du hast die Daten. Aber du musst noch herausfinden, was sie bedeuten, ob sie compliant sind, was als nächstes zu tun ist. Das ist keine Automatisierung. Das ist Transkription mit zusätzlichen Schritten.

Diese Erkenntnis hat zu Docuvera geführt.

Was bestehende Tools falsch machen

AWS Textract und Google Document AI sind wirklich gut in dem, was sie tun. Sie extrahieren Text aus Dokumenten mit solider Genauigkeit. Sie verarbeiten Tabellen, Formulare, Signaturen. Sie sind schnell und skalieren.

Aber Extraktion ist Schritt eins von fünf.

Schritt zwei ist das Verständnis von Kontext — ist das eine Krankenakte oder ein rechtlicher Vertrag? Schritt drei ist die Validierung — entspricht das dem Schema, das dir tatsächlich wichtig ist? Schritt vier ist das Flagging — was fehlt, was ist falsch, was braucht menschliche Überprüfung? Schritt fünf ist das Routing — wohin gehen diese Informationen, und welche Aktion lösen sie aus?

Commodity-OCR-Tools stoppen bei Schritt eins und überlassen dir den Rest. Für ein kleines Team, das ein paar hundert Dokumente pro Monat verarbeitet, ist das handhabbar. Für ein Unternehmen mit tausenden Seiten pro Woche über mehrere Dokumenttypen in mehreren regulatorischen Umgebungen ist es ein Flaschenhals, der nie verschwindet.

Was Docuvera anders macht

Die Kernwette: Domänenintelligenz ist wertvoller als generische Extraktion.

Ein medizinisches Aufnahmeformular ist nicht dasselbe wie ein Versicherungsanspruch, auch wenn beide PDFs mit Checkboxen und Signaturen sind. Die Felder, die zählen, sind verschieden. Die Validierungsregeln sind verschieden. Die Compliance-Anforderungen sind verschieden.

Statt also ein Modell zu bauen, das alles generisch liest, haben wir 12 vertikale Spezialisierungen gebaut — Gesundheitswesen, Recht, Finanzen, Logistik, Bau, Fertigung und mehr. Jedes Modell ist auf domänenspezifischen Daten vortrainiert. Es weiß, wie ein gültiger CPT-Code aussieht. Es kennt den Unterschied zwischen einer Bestellung und einem Lieferschein.

Wenn Docuvera ein Dokument verarbeitet, gibt es strukturierte Daten mit Konfidenz-Scores aus, kennzeichnet Anomalien gegenüber Domänenregeln, prüft auf Compliance-Anforderungen und leitet das Ergebnis an den richtigen Workflow. Das bedeutet “Entscheidungen, keine Extraktion” in der Praxis.

Wie wir es gebaut haben

Das Trainingsdaten-Problem war der schwierigste Teil.

Man kann kein Healthcare-Dokumentenmodell auf generischem Text trainieren. Man braucht echte Krankenakten, Aufnahmeformulare, Prior-Authorization-Anfragen — genug davon, mit genug Variation, um etwas zu bauen, das generalisiert. Wir haben am Ende Millionen domänenspezifischer Datenpunkte über die 12 Vertikalen hinweg. Das Beschaffen, Bereinigen, Labeln und Strukturieren für das Training hat länger gedauert als der Bau der Inferenz-Pipeline.

Die Architektur ist eine mehrstufige Pipeline. Erster Durchlauf: Dokumentklassifikation — was für ein Dokument ist das, welches vertikale Modell gilt. Zweiter Durchlauf: Feldextraktion mit dem vertikalspezifischen Modell. Dritter Durchlauf: Validierung gegen Domänenregeln. Vierter Durchlauf: Konfidenz-Scoring und Anomalie-Flagging. Fünfter Durchlauf: Output-Formatierung und Routing.

Jede Stufe ist unabhängig anpassbar. Wenn die Dokumente eines Kunden spezifische Eigenheiten haben, können wir auf der Ebene des vertikalen Modells fein-tunen, ohne die Kernpipeline anzufassen.

Die Verarbeitungsgeschwindigkeit war ein Constraint, den wir ernst nahmen. Etwa 2 Sekunden pro Seite bei Produktionslast. Das ist der durchschnittliche Durchsatz unter Last, kein Einzeldokument-Benchmark. Für ein Team, das täglich tausende Seiten verarbeitet, ist die Mathematik relevant.

Echte Zahlen

Die Metriken, die sich letztendlich am wichtigsten erwiesen haben:

~95% Genauigkeit bei der Feldextraktion über alle Vertikalen. Diese Zahl ist weniger als Überschrift wichtig und mehr als Boden — das Konfidenz-Scoring fängt den Rest und leitet ihn zur menschlichen Überprüfung weiter, statt schlechte Daten still weiterzuleiten.

~2 Sekunden pro Seite durchschnittliche Verarbeitungszeit. Schnell genug, dass Dokumentverarbeitung kein Planungsproblem mehr ist.

~4,5 Stunden pro Woche gespart pro Mitarbeiter, der zuvor Dokumente manuell bearbeitet hat.

Der Compliance-Aspekt

Regulierte Branchen wollen nicht nur genaue Extraktion — sie brauchen einen Audit-Trail.

DSGVO erfordert zu wissen, welche personenbezogenen Daten in deinen Dokumenten existieren, woher sie kamen und wer sie berührt hat. OSHA erfordert spezifische Log-Formate und Aufbewahrungsrichtlinien. Gesundheitswesen hat HIPAA. Finanzen hat ein Dutzend überlappender Frameworks.

Compliance-Awareness in die Verarbeitungspipeline einzubauen — nicht als Nachrüstung — hat das Produkt erheblich verändert. Docuvera kennzeichnet PII automatisch, protokolliert jeden Verarbeitungsschritt mit Zeitstempeln und Modellversionen und produziert Compliance-Berichte als erstklassigen Output.

Das stellte sich als größerer Differenziator heraus als die Genauigkeitszahlen. Unternehmen in regulierten Branchen wollen nicht nur einen schnelleren Dokumentenverarbeiter — sie wollen einen, den sie prüfen können.

Was ich gelernt habe

Die technischen Probleme waren schwer. Das Domänenwissen-Problem war schwerer.

Man kann Ingenieure einstellen, um eine Pipeline zu bauen. Man kann den Prozess nicht abkürzen, 12 Branchen tatsächlich gut genug zu verstehen, um Modelle zu bauen, die in der Produktion nützlich sind. Das erforderte Gespräche mit hunderten von Praktikern — medizinischen Abrechnungsexperten, Logistikkoordinatoren, Bau-Projektmanagern — und das Verständnis nicht nur, welche Dokumente sie verarbeiten, sondern warum bestimmte Felder wichtig sind.

Genauigkeit ist nicht das Ziel. Entscheidungsqualität ist das Ziel. Ein System, das 99% der Felder korrekt extrahiert, aber den Output an den falschen Workflow leitet, ist schlimmer als nutzlos.

Domänenintelligenz wächst kumulativ. Jede vertikale Spezialisierung macht die benachbarten einfacher zu bauen. Der Graben ist nicht die Pipeline-Architektur — es ist das Domänenwissen, das in die Modelle eingebettet ist.

← arrow keys or swipe →