LLM

Материал из Montelibero
Перейти к навигацииПерейти к поиску

LLM (Large Language Model, большая языковая модель) — модель глубокого обучения, обученная на массиве текстовых данных и способная понимать и генерировать естественный язык.

Общее

LLM обрабатывает текст на уровне токенов. Количество параметров модели измеряется в миллиардах (1B–400B+). Чем больше параметров, тем выше способность модели к обобщению и генерации связного текста.

Ключевые свойства:

  • Генерация —produces текст (ответы, код, перевод).
  • Понимание контекста — способна учитывать предшествующий текст в рамках контекстного окна.
  • Нулев-shot и few-shot обучение — может решать задачи без дополнительного обучения или с несколькими примерами в промпте.

Контекст в сессии

LLM не запоминает прошлые сессии между запросами. Вся информация из предыдущих сообщений должна передаваться явно — через историю в контексте. Это ограничивает длину взаимодействия размером контекстного окна.

Связанные понятия