Перейти к содержимому
Carbonfay
EN

услуга

Обработка документов с помощью ИИ

ИИ для обработки документов: извлечение полей, классификация и сверка как шаг управляемого процесса с контролем человека на спорных случаях, а не отдельный «волшебный» продукт.

Кейсы

Обработка документов с помощью ИИ — частая первая точка автоматизации: «у нас тонна счетов и заявок, давайте их распознавать». Но «загрузить картинку в модель и забрать поля» — рабочий прототип и плохая прод-система. Мы строим обработку документов как шаг управляемого процесса: распознавание, извлечение, сверка по правилам и контроль человека там, где результат сомнителен.

Что значит «ИИ-обработка документов»

Это связка из нескольких слоёв, а не одна модель: получение файла из канала (почта, портал, мессенджер, сканер), распознавание текста и таблиц, извлечение полей под конкретный тип документа, классификация (это счёт или акт?), сверка с эталонами и учётными системами, передача спорных случаев человеку. Каждый из этих слоёв проверяемый и заменяемый — в отличие от чёрного ящика «загрузил и получил».

OCR и LLM — честная граница

OCR превращает изображение в текст: знаки, координаты, таблицы. На чистых однотипных формах хорошего качества — этого достаточно: добавил правила извлечения полей и закрыл задачу без LLM. Это дёшево, предсказуемо и быстро.

LLM-извлечение нужно, когда документы разнородные: разные шаблоны счетов, свободный текст в письмах, нетиповые формулировки в договорах. Модель опирается на распознанный текст и достаёт поля по описанию, а не по координатам. Цена — выше, ошибки тоньше, нужны пороги уверенности.

В проде живёт связка: OCR делает «грубую» работу с текстом, LLM — «тонкую» с пониманием, детерминированная сверка ловит то, чему верить нельзя. Пытаться обойтись только одним слоем — частая причина, почему «у нас распознавание работает, а в учёте всё равно ошибки».

Извлечение, классификация, сверка

Извлечение полей — даты, суммы, ИНН, номера, контрагент, позиции в таблице. По каждому полю — модель уверенности; ниже порога — в ручную очередь.

Классификация — тип документа, статус, маршрут. Это шаг, после которого решается, куда документ идёт дальше и какая логика применяется.

Сверка — кросс-проверка по правилам и учётным системам: совпадает ли сумма по позициям с итогом, существует ли контрагент в справочнике, валиден ли номер договора. Сверка — это то, что отличает «распознали» от «можно проводить».

Контроль человека — не «опциональная фича»

Любая ИИ-обработка документов даёт ошибки; вопрос только в том, видны ли они до того, как ушли в учёт. Поэтому мы делаем явные пороги уверенности: всё ниже — в очередь ручного подтверждения, всё выше — автоматом через тот же контракт, по которому работают сотрудники. На каждом документе видно, какое поле извлечено как и из какой строки — это даёт честную трассировку и снимает страх «а вдруг ИИ что-то пропустил».

Где это даёт реальный эффект

Бухгалтерия (счета, акты, накладные, банковские выписки), кадровый учёт (заявления, уставные), страховые и медицинские формы, заявки и обращения с приложениями, скан-копии договоров. Эффект считается по двум осям: скорость обработки документа и доля документов, прошедших без участия человека. Обе цифры меряются до и после — без этого «внедрили ИИ» превращается в маркетинг, а не в результат.

Почему так, а не «коробочный распознаватель»

Коробочный сервис умеет распознавать типовые формы, но не знает ваших правил сверки, маршрутов и интеграций с учётными системами. Мы строим обработку документов как шаг операционного агента с явными контрактами, наблюдаемостью и контролем человека. Подробнее — внедрение ИИ в компанию, автоматизация бизнес-процессов и инженерные кейсы.

Глубже по теме

частые вопросы

Вопросы по делу

Какие документы можно обрабатывать ИИ?
Структурированные и полуструктурированные: счета, акты, договоры, заявки, паспорта, уставные документы, медицинские формы, чеки, накладные. Сложнее — рукописное и плохо отсканированное; здесь решает не столько модель, сколько процесс сверки и точка передачи человеку.
OCR или LLM — что лучше для обработки документов?
Это не «или». OCR превращает изображение в текст, LLM понимает смысл и извлекает поля. Для чистых типовых форм достаточно OCR с правилами и без LLM. Для разнородных документов выигрывает связка: OCR + LLM-извлечение + детерминированная сверка. Пытаться «загрузить картинку в LLM и получить всё» — рабочий прототип и плохая прод-система.
Сколько стоит обработка документов с помощью ИИ?
Зависит от типа документов, объёма потока, требований к точности и регламента (нужна ли подпись бухгалтера на сомнительных случаях). Сама модель — часть стоимости; остальное — подготовка обучающей разметки, правила сверки, очередь ручного контроля. Разумный старт — один тип документа на одном процессе.
Как контролировать ошибки и не пустить плохие данные в учётные системы?
Через явные пороги уверенности: всё ниже порога идёт в ручную очередь, всё выше — в учётную систему через тот же контракт, что и у людей. Каждый документ — со ссылкой на исходник и трассировкой: какое поле извлечено как и из какой строки. Без этого автоматизация документов становится новым источником невидимых ошибок.

связанные кейсы

Следующий шаг

Спроектируем слой автоматизации на ИИ под ваши процессы.

DBCV