LLM
Материал из Montelibero
LLM (Large Language Model, большая языковая модель) — модель глубокого обучения, обученная на массиве текстовых данных и способная понимать и генерировать естественный язык.
Общее
LLM обрабатывает текст на уровне токенов. Количество параметров модели измеряется в миллиардах (1B–400B+). Чем больше параметров, тем выше способность модели к обобщению и генерации связного текста.
Ключевые свойства:
- Генерация —produces текст (ответы, код, перевод).
- Понимание контекста — способна учитывать предшествующий текст в рамках контекстного окна.
- Нулев-shot и few-shot обучение — может решать задачи без дополнительного обучения или с несколькими примерами в промпте.
Контекст в сессии
LLM не запоминает прошлые сессии между запросами. Вся информация из предыдущих сообщений должна передаваться явно — через историю в контексте. Это ограничивает длину взаимодействия размером контекстного окна.
Связанные понятия
- Контекстное окно — лимит на объём текста за один запрос.
- Токен — единица текста, которую модель обрабатывает.
- Промпт — запрос к модели.