RAG
Материал из Montelibero
RAG (Retrieval-Augmented Generation, генерация с дополненной выборкой) — метод, при котором языковая модель дополняет свой ответ информацией из внешних источников, найденных по запросу.
Общее
LLM обучена на фиксированном наборе данных и не знает свежих фактов. RAG решает это: перед генерацией ответа система ищет релевантную информацию во внешних источниках и передаёт её в контекст модели.
Как работает
- Пользователь задаёт вопрос.
- Система преобразует запрос в вектор (эмбеддинг).
- Ищет похожие векторы в базе знаний.
- Извлекает релевантные документы.
- Передаёт их в контекст модели вместе с вопросом.
- Модель генерирует ответ на основе найденной информации.
Преимущества
- Актуальность — доступ к свежим данным без переобучения.
- Точность — ответы основаны на конкретных источниках.
- Снижение галлюцинаций — меньше выдумок при наличии фактов.
Связанные понятия
- Память ИИ — семантическая память использует RAG для поиска по прошлым взаимодействиям.
- Галлюцинация — проблема, которую RAG помогает снижать.
- LLM — модель, ответ которой дополняется через RAG.