Cosine similarity

Материал из Montelibero
Перейти к навигацииПерейти к поиску

Cosine similarity (косинусное сходство) — метрика близости двух векторов, измеряющая косинус угла между ними.

Общее

Косинусное сходство показывает, насколько два вектора «указывают в одном направлении», независимо от их длины.

Значения:

  • 1.0 — векторы идентичны по направлению (максимальное сходство).
  • 0.0 — векторы перпендикулярны (нет сходства).
  • −1.0 — векторы противоположны (максимальное различие).

Формула

cos(A, B) = (A · B) / (|A| × |B|)

Где:

  • A · B — скалярное произведение векторов.
  • |A|, |B| — длины (нормы) векторов.

Применение

  • Semantic search — сравнение эмбеддинга запроса с эмбеддингами документов.
  • RAG — поиск релевантных фрагментов.
  • Память ИИ — поиск похожих прошлых взаимодействий.
  • Рекомендательные системы — поиск похожих объектов.

Связанные понятия

  • Embedding — векторы, сходство которых измеряется.
  • Vector database — хранилище, использующее cosine similarity для поиска.