Илао Дзиндин

Docuvera: AI-документы, которые принимают решения, а не просто извлекают данные

Инструмент, который извлекает, сделал первый шаг из пяти.

шаг 1: извлечение   ──  какой здесь текст?
шаг 2: контекст     ──  что это за документ?
шаг 3: валидация    ──  соответствует ли схеме?
шаг 4: флаггинг     ──  чего не хватает, что не так?
шаг 5: маршрутизация ── что происходит дальше?

  обычный OCR останавливается здесь
  и передаёт остальное тебе.

Стена текста — это не автоматизация. Это транскрипция с лишними шагами.


Медицинская форма приёма — не страховое требование. Хотя оба — PDF с флажками и подписями.

Важные поля разные. Правила валидации разные. Требования к соответствию разные.

Универсальная модель видит оба одинаково. Мудрый знает разницу.


универсальная модель:       доменная модель:
────────────────────        ────────────────────
PDF → текст                 PDF → понятый документ
      ↓                           ↓
стена данных                структурированный смысл
      ↓                           ↓
твоя проблема               маршрутизированное решение

Работа после извлечения — там живёт настоящая стоимость. Доменный интеллект переносит эту работу внутрь модели.


реальные числа:

  ~95% точности         ──  по 12 вертикалям
  ~2 секунды на страницу ── под нагрузкой
  ~4.5 часа в неделю    ──  сэкономлено каждым сотрудником

Число точности важно не как заголовок. Как пол. Оценка уверенности ловит остальное — плохие данные не проходят молча.


Audit trail — не функция. Audit trail — предусловие.

В регулируемых отраслях вопрос не «работает ли это?» Вопрос: можешь ли ты доказать, что работало правильно, для кого, в какое время, какой версией модели?

Соответствие нормативам не добавлено. Оно заложено в основание.


Доменный интеллект накапливается.

Каждая вертикальная специализация углубляет понимание соседних. Ров — не в архитектуре pipeline. Ров — в годах доменного знания, закодированного в двенадцати моделях.

Илао Дзиндин