Chain-of-thought
Материал из Montelibero
Перейти к навигацииПерейти к поиску
Chain-of-thought (CoT, цепочка рассуждений) — техника промптинга, при которой модель сначала описывает ход рассуждений, а затем даёт финальный ответ.
Общее
Стандартный запрос: «Сколько будет 2+2?» → «4»
Запрос с CoT: «Сколько будет 2+2? Объясни ход решения.» → «Для сложения 2 и 2 нужно взять число 2, добавить к нему ещё 2. 2+2=4.»
Промежуточные шаги записываются в контекст, что помогает модели:
- Не допускать логических ошибок.
- Разбивать сложную задачу на этапы.
- Допускать корректировку на промежуточных этапах.
Разновидности
- Zero-shot CoT — добавление фразы «давай думать пошагово» без примеров.
- Few-shot CoT — модель получает несколько примеров с цепочкой рассуждений.
- Self-consistency — несколько прогонов CoT, выбор наиболее частого ответа.
Связанные понятия
- Промпт — техника применяется через формулировку промпта.
- Temperature — влияет на разнообразие промежуточных шагов в цепочке.