Cosine similarity
Материал из Montelibero
Перейти к навигацииПерейти к поиску
Cosine similarity (косинусное сходство) — метрика близости двух векторов, измеряющая косинус угла между ними.
Общее
Косинусное сходство показывает, насколько два вектора «указывают в одном направлении», независимо от их длины.
Значения:
- 1.0 — векторы идентичны по направлению (максимальное сходство).
- 0.0 — векторы перпендикулярны (нет сходства).
- −1.0 — векторы противоположны (максимальное различие).
Формула
cos(A, B) = (A · B) / (|A| × |B|)
Где:
- A · B — скалярное произведение векторов.
- |A|, |B| — длины (нормы) векторов.
Применение
- Semantic search — сравнение эмбеддинга запроса с эмбеддингами документов.
- RAG — поиск релевантных фрагментов.
- Память ИИ — поиск похожих прошлых взаимодействий.
- Рекомендательные системы — поиск похожих объектов.
Связанные понятия
- Embedding — векторы, сходство которых измеряется.
- Vector database — хранилище, использующее cosine similarity для поиска.