Перейти к содержимому
Carbonfay
EN

глоссарий

Векторный поиск (ANN)

Поиск ближайших соседей в пространстве эмбеддингов: индексы HNSW/IVF, фильтры по метаданным, отличие от классического поиска по точному совпадению.

Векторный поиск — это поиск ближайших к запросу объектов в пространстве эмбеддингов. Запрос превращается в вектор, выдача — ближайшие к нему по выбранной метрике. На небольших коллекциях это полный перебор; в проде используется приближённый поиск ближайших соседей (Approximate Nearest Neighbor, ANN) с индексами HNSW, IVF, PQ — они дают околомгновенный отклик ценой контролируемой погрешности.

Чем отличается от классического: реляционный поиск отвечает на «существует ли точно такая запись», векторный — на «что похоже по смыслу». Это разные классы запросов, и они не заменяют друг друга. В проде они почти всегда живут вместе: реляционная база держит сущности и связи, векторный поиск даёт смысловую выдачу с фильтрацией по метаданным (автор, дата, проект, доступ).

Где это работает: RAG-системы, рекомендации, дедупликация и связывание данных, кластеризация обращений, антифрод. Без фильтров по метаданным выдача быстро превращается в кашу: «похожее» оказывается не из той коллекции, не той свежести или не для этого пользователя — и никакой переранжер уже не помогает.

Все термины