Chain-of-thought

Материал из Montelibero
Перейти к навигацииПерейти к поиску

Chain-of-thought (CoT, цепочка рассуждений) — техника промптинга, при которой модель сначала описывает ход рассуждений, а затем даёт финальный ответ.

Общее

Стандартный запрос: «Сколько будет 2+2?» → «4»

Запрос с CoT: «Сколько будет 2+2? Объясни ход решения.» → «Для сложения 2 и 2 нужно взять число 2, добавить к нему ещё 2. 2+2=4.»

Промежуточные шаги записываются в контекст, что помогает модели:

  • Не допускать логических ошибок.
  • Разбивать сложную задачу на этапы.
  • Допускать корректировку на промежуточных этапах.

Разновидности

  • Zero-shot CoT — добавление фразы «давай думать пошагово» без примеров.
  • Few-shot CoT — модель получает несколько примеров с цепочкой рассуждений.
  • Self-consistency — несколько прогонов CoT, выбор наиболее частого ответа.

Связанные понятия

  • Промпт — техника применяется через формулировку промпта.
  • Temperature — влияет на разнообразие промежуточных шагов в цепочке.