← Назад до курсу

Базова теорія

🇬🇧 English
🌱 Рівень 1 — Новачок

Міркування

Здатності ШІ до міркувань — ланцюг думок, моделі з мисленням, логічний висновок.

Міркування — одна з найважливіших та найшвидше еволюціонуючих можливостей сучасного ШІ. Хоча ранні LLM могли генерувати плавний текст, вони часто мали проблеми з багатокроковою логікою, математикою та складним вирішенням задач. Впровадження промптингу ланцюгом думок та спеціалізованих моделей міркувань драматично покращило ці можливості.

Моделі як OpenAI o1/o3, DeepSeek-R1 та QwQ використовують "токени мислення" — вони міркують крок за кроком всередині перед видачею фінальної відповіді. Це відзеркалює людське розрізнення між швидким інтуїтивним мисленням (Система 1) та повільним обдуманим міркуванням (Система 2). Розуміння цих можливостей та їх обмежень критично важливе для знання, коли довіряти результатам ШІ.

Основні теми
Промптинг ланцюгом думок (CoT)
Прохання моделям "думати крок за кроком" драматично покращує точність на складних задачах. Замість стрибка до відповіді, модель показує свою роботу — розбиваючи задачі на керовані кроки.
Моделі міркувань
OpenAI o1/o3, DeepSeek-R1, QwQ (Alibaba) спеціально навчені для багатокрокових міркувань. Вони використовують додаткові обчислення під час інференсу щоб "думати довше" перед відповіддю.
Токени мислення
Внутрішні сліди міркувань, згенеровані перед фінальною відповіддю. Ці токени — "чернетка" моделі — пропрацьовування логіки, перевірка кроків, розгляд альтернатив.
Розширене мислення
Виділення більше обчислень під час інференсу для складніших задач. Модель може "думати довше" над складними запитаннями, обмінюючи швидкість на точність.
Математичне міркування
Розв'язання математичних задач олімпіадного рівня (AIME, AMC), формальні доведення, символічні маніпуляції. Моделі міркувань зробили драматичний прогрес — наближаючись до рівня людських експертів.
Кодове міркування
Дебагінг складних кодових баз, аналіз архітектури, реалізація складних алгоритмів. Кодове міркування — одна з найпрактичніших можливостей ШІ.
Логічний висновок
Силогізми, дедукція, задоволення обмежень, планування. Моделі можуть слідувати логічним правилам, але все ще мають проблеми з новими типами міркувань.
Мислення Системи 1 vs Системи 2
Фреймворк Канемана для ШІ: Система 1 = швидкі інтуїтивні відповіді (стандартний LLM), Система 2 = повільне обдумане міркування (моделі з токенами мислення).
Поточні обмеження
Моделі міркувань все ще збоять на справді нових задачах, можуть видавати переконливі але хибні ланцюги міркувань, та можуть передумувати прості питання. Верифікація залишається необхідною.
Бенчмарки міркувань
MATH (олімпіадна математика), GSM8K (шкільна), ARC-AGI (загальне міркування), SWE-bench (реальна інженерія ПЗ), Codeforces (змагальне програмування).
Ключові терміни
Ланцюг думокТехніка, де моделі пояснюють своє міркування крок за кроком перед відповіддю.
Токени мисленняВнутрішні сліди міркувань, згенеровані моделями перед фінальним результатом.
Система 1/Система 2Фреймворк Канемана: швидке інтуїтивне vs повільне обдумане мислення, застосоване до ШІ.
Обчислення під час тестуВиділення більше обробки під час інференсу для покращення міркувань на складніших задачах.
Практичні поради
Пов'язані обговорення спільноти