глоссарий
Эмбеддинги
Числовые представления текстов, изображений и других объектов, на которых работает поиск по смыслу и сравнение по близости.
Эмбеддинг — это вектор фиксированной размерности, в который специальная модель (эмбеддер) переводит текст, изображение или другой объект. Близость двух эмбеддингов по выбранной метрике (косинус, евклид, скалярное произведение) интерпретируется как смысловая близость исходных объектов: одинаковая мысль, выраженная разными словами, даёт близкие векторы.
Где это работает: поиск по смыслу в векторной базе, извлечение релевантных фрагментов в RAG-системе, рекомендации, дедупликация и связывание сущностей, кластеризация обращений, антифрод. В каждом из этих сценариев эмбеддинг — это не «магия», а способ свести «похоже по смыслу» к арифметике.
Что часто упускают: качество эмбеддера определяет потолок всего поиска. Замена модели меняет геометрию пространства: индекс, построенный на одних эмбеддингах, не работает на других без полной пересборки. Векторы должны быть нормализованы под выбранную метрику — иначе результаты случайны. Размерность и стоимость инференса напрямую влияют на латентность и бюджет, поэтому эмбеддер выбирается не «самый сильный», а самый сильный из вписывающихся в требования системы.