RAG

RAG (Retrieval-Augmented Generation, генерация с дополненной выборкой) — метод, при котором языковая модель дополняет свой ответ информацией из внешних источников, найденных по запросу.

Общее

LLM обучена на фиксированном наборе данных и не знает свежих фактов. RAG решает это: перед генерацией ответа система ищет релевантную информацию во внешних источниках и передаёт её в контекст модели.

Как работает

Пользователь задаёт вопрос.
Система преобразует запрос в вектор (эмбеддинг).
Ищет похожие векторы в базе знаний.
Извлекает релевантные документы.
Передаёт их в контекст модели вместе с вопросом.
Модель генерирует ответ на основе найденной информации.

Преимущества

Актуальность — доступ к свежим данным без переобучения.
Точность — ответы основаны на конкретных источниках.
Снижение галлюцинаций — меньше выдумок при наличии фактов.

Связанные понятия

Память ИИ — семантическая память использует RAG для поиска по прошлым взаимодействиям.
Галлюцинация — проблема, которую RAG помогает снижать.
LLM — модель, ответ которой дополняется через RAG.

RAG

Содержание

Общее

Как работает

Преимущества

Связанные понятия

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Main

Поиск

Навигация

Инструменты