"Чем RAG-агент отличается от ChatGPT по нашим документам?"

"ChatGPT отвечает из памяти модели и звучит уверенно даже когда выдумывает. RAG-агент сначала ищет фрагменты в вашей базе, отвечает строго из найденного и прикладывает ссылку на источник. Если в документах ответа нет — он это говорит, а не дополняет правдоподобной выдумкой. Для регламентов и клиентских ответов это принципиально."

"Что делает агент, если ответа нет в базе?"

"Честно отвечает, что в источниках не нашёл, и при необходимости передаёт вопрос человеку. Это сознательная граница, а не недоработка: лучше «не знаю», чем уверенный неверный ответ по регламенту или договору. Порог релевантности настраивается под цену ошибки в конкретном процессе."

"Можно ли проверить, откуда агент взял ответ?"

"Да, в этом смысл. К каждому ответу прикладываются фрагменты-источники со ссылкой на документ и раздел — сотрудник или клиент видит, на чём основан ответ, и может открыть первоисточник. Это снимает спор «агент так сказал» и делает ответы аудируемыми."

"Как агент остаётся актуальным при изменении документов?"

"Он отвечает не по «вшитым» знаниям, а по живому индексу. Обновился регламент — переиндексируется документ, и агент сразу отвечает по новой версии. Построение и обновление этого индекса — отдельная задача векторной базы знаний, на которую агент опирается."

Знания и поиск

RAG-агент по корпоративной базе знаний

RAG-агент отвечает на вопросы сотрудников и клиентов по вашим документам и регламентам — с опорой на источник и ссылкой на него. Нет в базе — честно говорит, что нет.

RAG-системы

«Сотрудники по сто раз спрашивают одно и то же, давайте посадим ИИ на нашу базу знаний» — понятный запрос. Но «дать модели документы и спросить» порождает уверенные выдумки: модель достроит ответ, которого в регламенте нет, и сделает это убедительно. RAG-агент строится иначе: сначала поиск по вашей базе, ответ строго из найденного со ссылкой на источник, и честное «не нашёл» там, где источников нет.

Что он делает

Принимает вопрос сотрудника или клиента в любом канале, ищет релевантные фрагменты в векторном индексе ваших документов, регламентов и истории обращений и формирует ответ строго из найденного. К каждому ответу прикладывает ссылку на документ и раздел, чтобы человек видел первоисточник. Если релевантного в базе нет — отвечает «в источниках не нашёл» и при необходимости передаёт человеку. Это не чат «по мотивам» корпоративных знаний, а аудируемый ответ с трассировкой до конкретного документа.

Где проходит граница

Главный риск RAG — не «не нашёл ответ», а уверенно выданная выдумка, которую невозможно отличить от факта. Поэтому отказ — часть контракта агента: порог релевантности, явное «в базе нет», ссылка на источник под каждым ответом. Поиск по знаниям внутри агента — это полноценная RAG-система, а его качество напрямую зависит от того, как собрана векторная база знаний: без чистого индекса даже идеальная модель будет отвечать по мусору.

Как устроена цепочка

01
Поиск по базе знаний · эмбеддер
По вопросу находит релевантные фрагменты в векторном индексе документов, регламентов и истории — по смыслу, а не по совпадению слов.
02
Ответ с опорой на источник · RAG + средняя модель
Формирует ответ строго из найденных фрагментов и прикладывает ссылку на документ и раздел. Опора — на источник, а не на память модели.
03
Контроль покрытия · правило + модель
Если релевантных фрагментов нет или они слабые — отвечает «в базе не нашёл», а не выдумывает. Граница вместо галлюцинации.

Интеграции

OpenAI

YandexGPT

Google Sheets

+ любой внешний API

Калькулятор стоимости

Запросов в сутки 200

Субмоделей в цепочке 3

Модель

Токены, ₽/мес

—

Разработка, ₽

—

Поддержка, ₽/мес

—

Оценка по усреднённой ставке за токен (вход+выход). Точная стоимость зависит от длины контекста, числа вызовов и доли ручного контроля — посчитаем по вашему процессу.

связанные кейсы

ИИ-системы

Платформа корпоративных знаний и контекста для ИИ

ИИ-системы

RAG-агент по корпоративной базе знаний

Что он делает

Где проходит граница

Платформа корпоративных знаний и контекста для ИИ

ИИ-ассистент клиентского взаимодействия и рекомендаций

Вопросы по делу

Спроектируем слой автоматизации на ИИ под ваши процессы.