Semantic search

Материал из Montelibero
Перейти к навигацииПерейти к поиску

Semantic search (семантический поиск) — метод поиска информации по смыслу запроса, а не по совпадению ключевых слов.

Общее

Классический поиск: запрос «купить ноутбук» → ищет страницы, содержащие слова «купить» и «ноутбук».

Семантический поиск: запрос «купить ноутбук» → находит также «приобрести портативный компьютер», «заказать лэптоп» — потому что смысл тот же.

Как работает

  1. Запрос пользователя кодируется в Embedding.
  2. Документы в базе также закодированы в эмбеддинги.
  3. Вычисляется Cosine similarity между запросом и документами.
  4. Возвращаются документы с наибольшим сходством.

Применение

  • RAG — поиск релевантных документов для дополнения генерации.
  • Память ИИ — поиск по прошлым взаимодействиям.
  • Базы знаний — поиск в корпоративных документах.

Связанные понятия

  • Embedding — основа семантического поиска.
  • Vector database — хранилище эмбеддингов.
  • RAG — использует семантический поиск.