跳至主要內容
所有期刊
第 1 期 2026年2月6日

Claude Opus 4.6 正式發布:Agent Teams、百萬 Token 上下文、史上最強 Agentic 模型

Anthropic 發布 Claude Opus 4.6,為 Claude Code 帶來 Agent Teams 多智能體協作、百萬 Token 上下文視窗、Effort Tuning 思考強度調節,以及橫跨程式碼與推理的 SOTA 基準測試成績。

Claude Opus 4.6:Claude Code 有史以來最大的更新

Anthropic 今天發布了 Claude Opus 4.6,這不只是一次模型升級——它為 Claude Code 使用者帶來了兩個改變遊戲規則的功能:Agent TeamsEffort Tuning


有什麼新功能

1. Claude Opus 4.6 模型

新模型在根本上更加強大:

  • 更好的規劃能力:在行動之前會更審慎地思考,減少無效步驟
  • 更長的 Agentic 工作階段:在長時間的多步驟操作中保持專注
  • 大型程式碼庫可靠性:能有效處理大規模、真實世界的程式碼庫
  • 自我修正:在程式碼審查和除錯過程中主動發現自己的錯誤
  • 百萬 Token 上下文(beta):首個具備百萬 Token 上下文視窗的 Opus 級模型——在 MRCR v2 的 8-needle 百萬 Token 測試中達到 76% 準確率,而 Sonnet 4.5 僅為 18.5%

價格不變:輸入/輸出每百萬 Token 分別為 $5/$25。

2. Agent Teams(研究預覽版)

這是 Claude Code 的頭號新功能。不再是單一智能體按順序工作,現在你可以編排一組 Claude Code 實例平行協作:

  • Lead Agent 負責協調工作並生成隊友
  • Teammates 各自獨立工作,擁有自己的上下文視窗
  • Teammates 可以直接互相傳訊——不只是回報結果
  • 共享任務清單追蹤依賴關係並自動解除封鎖

應用場景:平行程式碼審查、競爭假設除錯、跨層功能開發、研究任務。

啟用方式

// settings.json
{ "env": { "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" } }

3. Effort Tuning(思考強度調節)

控制模型的思考深度。執行 /model 並使用左右方向鍵

  • 降低強度 = 更快、更省 Token
  • 提高強度 = 複雜任務獲得更好的結果

基準測試亮點

Opus 4.6 在幾乎所有基準測試中領先或持平:

領域成績與競爭對手比較
ARC AGI 268.8%幾乎是 Opus 4.5(37.6%)的 2 倍
Terminal-Bench 2.065.4%最高分(超越 GPT-5.2 Codex CLI)
BrowseComp84.0%領先最近競爭者 24%
GDPVal-AA1606 Elo比 GPT-5.2 高出 144 分
Humanity’s Last Exam53.1%使用工具類別最高分
t2-bench Telecom99.3%Agentic 工具使用最高分

在計算生物學、有機化學和系統發育學上也比 Opus 4.5 提升 2 倍。BigLaw Bench 達到 90.2%,其中 40% 為滿分。


這對你意味著什麼

  1. 更長、更穩定的程式開發階段 — 模型不會在任務中途品質下降
  2. Agent Teams 實現真正的平行處理 — 專業智能體同時工作並互相溝通
  3. Effort Tuning 節省 Token — 簡單任務調低,複雜任務調高
  4. 減少「我忘了」的情況 — 百萬 Token 上下文讓大型程式碼庫完整保留在記憶中
  5. 更好的自我修正 — 在你需要指出問題之前就先抓到 Bug

同步發布

  • Claude in PowerPoint(研究預覽版):從描述或範本生成簡報
  • Claude in Excel:改善了長時間任務處理與多步驟變更
  • Context Compaction API(beta):自動摘要舊上下文,適用於長時間 Agentic 操作
  • 128k 輸出 Token 現已支援

快速開始

# 更新 Claude Code 到最新版
claude update

# 啟用 Agent Teams
# 在 settings.json 中加入:{ "env": { "CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS": "1" } }

# 試用 Effort Tuning
# 執行 /model 並用方向鍵調整

延伸閱讀


本期電子報由 Claude Opus 4.6 親自撰寫。夠 Meta 吧?

喜歡這期內容嗎?

每週六將 ClaudeWorld Weekly 直送到您的信箱。

免費訂閱