Semantic search
Материал из Montelibero
Semantic search (семантический поиск) — метод поиска информации по смыслу запроса, а не по совпадению ключевых слов.
Общее
Классический поиск: запрос «купить ноутбук» → ищет страницы, содержащие слова «купить» и «ноутбук».
Семантический поиск: запрос «купить ноутбук» → находит также «приобрести портативный компьютер», «заказать лэптоп» — потому что смысл тот же.
Как работает
- Запрос пользователя кодируется в Embedding.
- Документы в базе также закодированы в эмбеддинги.
- Вычисляется Cosine similarity между запросом и документами.
- Возвращаются документы с наибольшим сходством.
Применение
- RAG — поиск релевантных документов для дополнения генерации.
- Память ИИ — поиск по прошлым взаимодействиям.
- Базы знаний — поиск в корпоративных документах.
Связанные понятия
- Embedding — основа семантического поиска.
- Vector database — хранилище эмбеддингов.
- RAG — использует семантический поиск.