LLM

LLM (Large Language Model, большая языковая модель) — модель глубокого обучения, обученная на массиве текстовых данных и способная понимать и генерировать естественный язык.

Общее

LLM обрабатывает текст на уровне токенов. Количество параметров модели измеряется в миллиардах (1B–400B+). Чем больше параметров, тем выше способность модели к обобщению и генерации связного текста.

Ключевые свойства:

Генерация —produces текст (ответы, код, перевод).
Понимание контекста — способна учитывать предшествующий текст в рамках контекстного окна.
Нулев-shot и few-shot обучение — может решать задачи без дополнительного обучения или с несколькими примерами в промпте.

Контекст в сессии

LLM не запоминает прошлые сессии между запросами. Вся информация из предыдущих сообщений должна передаваться явно — через историю в контексте. Это ограничивает длину взаимодействия размером контекстного окна.

Связанные понятия

Контекстное окно — лимит на объём текста за один запрос.
Токен — единица текста, которую модель обрабатывает.
Промпт — запрос к модели.

LLM

Общее

Контекст в сессии

Связанные понятия

Навигация

Действия на странице

Действия на странице

Персональные инструменты

Main

Поиск

Навигация

Инструменты