Перейти к содержимому
Carbonfay
EN

Документы и данные

ИИ-агент обработки документов

ИИ-агент для документов: извлекает поля из счетов, договоров и актов, сверяет по правилам и выгружает в учётную систему. Спорные случаи — человеку, остальное — автоматом.

«У нас тонна счетов и заявок, давайте их распознавать» — частая точка входа в автоматизацию. Но «загрузить картинку в модель и забрать поля» — рабочий прототип и плохая прод-система. Агент обработки документов строится как управляемый процесс: распознавание, извлечение, сверка по правилам и контроль человека там, где результат сомнителен.

Что он делает

Получает документ из канала (почта, портал, сканер), распознаёт текст и таблицы, извлекает поля под конкретный тип документа, классифицирует и сверяет с эталонами и учётными системами. Спорные случаи уходят в ручную очередь, остальное проводится автоматически. Каждый слой проверяемый и заменяемый — в отличие от чёрного ящика «загрузил и получил».

Где проходит граница

Любая автоматическая обработка даёт ошибки; вопрос в том, видны ли они до того, как ушли в учёт. Поэтому контроль человека — не опция, а часть контракта: пороги уверенности, очередь ручной сверки, трассировка каждого поля. Подробнее об инженерии — на странице обработки документов с ИИ; извлечение из неструктурированного текста опирается на векторный поиск там, где нужен смысл, а не шаблон.

Как устроена цепочка

  1. 01
    Распознавание (OCR) · OCR-движок

    Превращает скан или фото в текст с координатами и таблицами. На чистых формах этого уже достаточно.

  2. 02
    Извлечение полей · средняя модель

    Достаёт даты, суммы, реквизиты, позиции по описанию, а не по жёсткому шаблону — работает на разнородных документах.

  3. 03
    Сверка по правилам · детерминированный код

    Проверяет суммы, контрагента в справочнике, валидность номеров. Ловит то, чему нельзя доверять автоматом.

Интеграции

OpenAI YandexGPT Google Sheets DaData

+ любой внешний API

Калькулятор стоимости

200
3
Токены, ₽/мес
Разработка, ₽
Поддержка, ₽/мес

Оценка по усреднённой ставке за токен (вход+выход). Точная стоимость зависит от длины контекста, числа вызовов и доли ручного контроля — посчитаем по вашему процессу.

связанные кейсы

частые вопросы

Вопросы по делу

Какие документы агент умеет обрабатывать?
Счета, акты, договоры, заявки, накладные, паспорта, уставные документы. Сложнее — рукописное и плохо отсканированное; здесь решает не столько модель, сколько процесс сверки и точка передачи человеку.
OCR или LLM — что используется?
Связка. OCR превращает изображение в текст, модель извлекает поля по смыслу, детерминированная сверка ловит ошибки. На чистых типовых формах хватает OCR с правилами без модели — это дешевле и предсказуемее.
Как не пустить ошибки в учётную систему?
Через явные пороги уверенности: всё ниже порога идёт в ручную очередь, всё выше — в систему через тот же контракт, что и у людей. На каждом документе видно, какое поле извлечено как и из какой строки — честная трассировка.
Где это даёт эффект?
Бухгалтерия (счета, акты, выписки), кадры, страховые и медицинские формы, заявки с приложениями. Эффект меряется по скорости обработки и доле документов, прошедших без участия человека — до и после.

Следующий шаг

Спроектируем слой автоматизации на ИИ под ваши процессы.

DBCV