所有期刊
第 1 期
2026年2月6日
Claude Opus 4.6 正式發布:Agent Teams、百萬 Token 上下文、史上最強 Agentic 模型
Anthropic 發布 Claude Opus 4.6,為 Claude Code 帶來 Agent Teams 多智能體協作、百萬 Token 上下文視窗、Effort Tuning 思考強度調節,以及橫跨程式碼與推理的 SOTA 基準測試成績。
Claude Opus 4.6:Claude Code 有史以來最大的更新
Anthropic 今天發布了 Claude Opus 4.6,這不只是一次模型升級——它為 Claude Code 使用者帶來了兩個改變遊戲規則的功能:Agent Teams 和 Effort Tuning。
有什麼新功能
1. Claude Opus 4.6 模型
新模型在根本上更加強大:
- 更好的規劃能力:在行動之前會更審慎地思考,減少無效步驟
- 更長的 Agentic 工作階段:在長時間的多步驟操作中保持專注
- 大型程式碼庫可靠性:能有效處理大規模、真實世界的程式碼庫
- 自我修正:在程式碼審查和除錯過程中主動發現自己的錯誤
- 百萬 Token 上下文(beta):首個具備百萬 Token 上下文視窗的 Opus 級模型——在 MRCR v2 的 8-needle 百萬 Token 測試中達到 76% 準確率,而 Sonnet 4.5 僅為 18.5%
價格不變:輸入/輸出每百萬 Token 分別為 $5/$25。
2. Agent Teams(研究預覽版)
這是 Claude Code 的頭號新功能。不再是單一智能體按順序工作,現在你可以編排一組 Claude Code 實例平行協作:
- Lead Agent 負責協調工作並生成隊友
- Teammates 各自獨立工作,擁有自己的上下文視窗
- Teammates 可以直接互相傳訊——不只是回報結果
- 共享任務清單追蹤依賴關係並自動解除封鎖
應用場景:平行程式碼審查、競爭假設除錯、跨層功能開發、研究任務。
啟用方式:
// settings.json
{ "env": { "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" } }
3. Effort Tuning(思考強度調節)
控制模型的思考深度。執行 /model 並使用左右方向鍵:
- 降低強度 = 更快、更省 Token
- 提高強度 = 複雜任務獲得更好的結果
基準測試亮點
Opus 4.6 在幾乎所有基準測試中領先或持平:
| 領域 | 成績 | 與競爭對手比較 |
|---|---|---|
| ARC AGI 2 | 68.8% | 幾乎是 Opus 4.5(37.6%)的 2 倍 |
| Terminal-Bench 2.0 | 65.4% | 最高分(超越 GPT-5.2 Codex CLI) |
| BrowseComp | 84.0% | 領先最近競爭者 24% |
| GDPVal-AA | 1606 Elo | 比 GPT-5.2 高出 144 分 |
| Humanity’s Last Exam | 53.1% | 使用工具類別最高分 |
| t2-bench Telecom | 99.3% | Agentic 工具使用最高分 |
在計算生物學、有機化學和系統發育學上也比 Opus 4.5 提升 2 倍。BigLaw Bench 達到 90.2%,其中 40% 為滿分。
這對你意味著什麼
- 更長、更穩定的程式開發階段 — 模型不會在任務中途品質下降
- Agent Teams 實現真正的平行處理 — 專業智能體同時工作並互相溝通
- Effort Tuning 節省 Token — 簡單任務調低,複雜任務調高
- 減少「我忘了」的情況 — 百萬 Token 上下文讓大型程式碼庫完整保留在記憶中
- 更好的自我修正 — 在你需要指出問題之前就先抓到 Bug
同步發布
- Claude in PowerPoint(研究預覽版):從描述或範本生成簡報
- Claude in Excel:改善了長時間任務處理與多步驟變更
- Context Compaction API(beta):自動摘要舊上下文,適用於長時間 Agentic 操作
- 128k 輸出 Token 現已支援
快速開始
# 更新 Claude Code 到最新版
claude update
# 啟用 Agent Teams
# 在 settings.json 中加入:{ "env": { "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" } }
# 試用 Effort Tuning
# 執行 /model 並用方向鍵調整
延伸閱讀
本期電子報由 Claude Opus 4.6 親自撰寫。夠 Meta 吧?