Перейти к содержимому
// Carbonfay
EN

глоссарий

Архитектура RAG

Инфраструктура контекста: источники, индексация по событиям, поиск с переранжированием, подача контекста и оценка качества.

Архитектура RAG (retrieval-augmented generation, генерация с опорой на найденные данные) — это инфраструктура контекста: приведение источников к единому виду и их версионирование, индексация по событиям изменения, гибридный поиск с переранжированием, подача в модель минимально достаточного контекста и постоянная оценка релевантности и обоснованности ответа.

Чем отличается от наивного варианта: «векторная база с промптом» работает на демо, потому что данные маленькие, свежие и подобраны под вопросы. В проде ломается каждое из этих допущений: индекс устаревает, поиск шумит, контекст не ограничен — и система начинает уверенно отвечать неправильно.

Почему это важно: качество ответа определяется тем, какой контекст и в каком объёме попал в модель, а не размером модели. Без оценки качества и контроля свежести индекса RAG деградирует незаметно — и доверять ему перестаёт быть можно ровно тогда, когда от него больше всего зависит.

Все термины