Field Report DOC—ANTHROPIC/SHIP REV 2026.04 · a
— Roadmaps Are Dead · Inside the Anthropic Shipping Machine —

Roadmap 已死·Anthropic 的出貨機器

Compiled by 2026·04·26 After Cat Wu · Anthropic
figure 00 · velocity 1d Concept-to-User
cycle.
6-month roadmap

傳統 PM 的劇本正在被現實撕碎。當大多數科技公司還困在「Waterfall–Agile 混血」、被 6–12 個月 roadmap 與排不完的 alignment 會議窒息時,Anthropic 已經在另一個時鐘運轉。

Claude Code & Co-work 產品負責人 Cat Wu 揭露:他們把 feature cycle 從「月」壓縮到「週」,常常壓到單一一天。對現代 PM 而言,這不是趨勢,是存在性威脅——「協調階級」(每天更 Jira、寫 PRD 寫到 launch 時功能已過時)正在絕跡。

但角色不是死亡,是升級成更技術、更槓桿、更「無形」。本文拆解 Anthropic 出貨文化的 5 個核心機制——從殺死 roadmap、Eval-Driven PM、Eating the Harness,到 Just Do Things 的工作哲學。

Legend · 圖例

  • Structural
  • New Mechanism
  • Highlight
  • The Old Way
01/05
— Roadmap is a Liability
Roadmap 是負債 · 不是橋樑
在高速 AI 環境裡,PM 的核心功能不再是「協調」,而是「無情移除出貨摩擦」。 Anthropic 用 Evergreen Launch Room 取代 roadmap——把 idea 從工程師腦袋送到使用者手上,目標一週以內。
// shipping-infra
6 mo
LEGACY · 6 MONTHS
Old Roadmap傳統規劃週期
1 mo
SHRUNK
Compressed壓縮後常態
1 d
Concept Corner單日出貨極限
我們很多產品功能的時程從 6 個月降到 1 個月,有時甚至到一天⋯⋯我們想移除任何出貨的障礙— Cat Wu · Head of Product, Claude Code & Co-work
02/05
— Eval-Driven PM
產品品味 · 寫成可量化的 Eval
當 LLM 讓寫程式變便宜,競爭優勢從「能寫」轉到「決定該寫什麼」。 這就是 Product Taste——而 Anthropic 把它寫成技術要求:你能不能寫 10 個好 eval?
// 100-percent-rule
Status Quo · 大多數 AI 產品
95%

不是自動化 · 是雜事

一個準確率 95% 的功能,不是自動化——是一份「每次都需要人盯著」的雜事。剩下的 5% 失敗率,意味著人類得守在迴圈裡確認每一次輸出。

結果:使用者沒有真的脫手——只是換了一種「babysit AI」的方式而已。
Anthropic · 100% Reliability Rule
100%

真自動化 · 一人管 50 個 Claude

要讓「一個人同時管理 50 個 Claude」這種工作流規模化,那 5% 錯誤率就是斷裂點。從 95% 進化到 100% 的最後一哩,是 PM 的真功夫。

方法:不是寫更多 prompt——是寫 eval。把「成功」變成可量化、可重複驗證的標準。
10+

每個 PM 都該寫得出 10 個好 Eval

現代 PM 的「技術技能」不是會寫 Python——是會寫 eval。如果你不能具體定義並度量使用者體驗的「Golden Path」,你不是在管產品,你只是在用 prompt 賭博

03/05
— Amorphous PM & Eating the Harness
角色之間界線模糊 · 跳脫傳統框架
PM、Engineer、Designer 的邊界不只是模糊——是一種負債。 AI Native 員工是「無形的專業人」:能 land code 的 PM、有產品品味的工程師。
// roles-dissolve
PM

能 land code 的 PM

— Code-Capable

不只是寫 spec——能 sense the effort,本能判斷一個功能是 1 小時還是 1 週。免去無效辯論。

ENG

有產品品味的工程師

— Taste-Driven

不只是實作——能判斷「這該寫嗎、誰會用、值不值」,把工程資源投在真正會被使用的地方。

SALES

會用 Claude Code 的銷售

— Personalized Software

用 Claude Code 自建客製化 Salesforce 連動 web app,幾秒生出對的 deck,而不是花幾小時。

核心轉變: 技術流暢度讓 PM 能「感受工作量」——一個功能要多久心裡有底,這省下大量「該做什麼、要多久」的反覆會議,讓團隊直接 just build it
Eating the Harness · 模型變強,UI 反而縮小
UI 是「拐杖」——當模型聰明到不用拐杖時,UI 應該主動消失
Stage · A
早期模型
Sonnet · with Crutch
To-Do List
Step Tracker

模型記不住任務、會忘步驟——UI 加上 to-do、進度追蹤等「拐杖功能」幫它撐住。

Stage · B
智能跳級
Opus 4 · No Need
— legacy —
— legacy —

模型自己會追蹤、會分步驟——拐杖功能變成 legacy 殘留,使用者甚至不會用到。

Stage · C
UI 縮小
Native & Lean

把拐杖拿掉,介面回到最精簡——這才是 Eating the Harness:模型吃掉自己過去需要的支撐。

代價:產品一致性。Anthropic 願意犧牲統一 UI 與使用者教育,換取原始測試速度。功能可能重疊、使用者像在「越跑越快的跑步機」上——這就是 PowerUp(內建 onboarding)出現的原因:產品比使用者直覺進化得更快。
04/05
— Chat → Action
從聊天到行動 · 世代切換
產業正從「2024 世代(Chat)」轉到「Claude Code 世代(Action)」—— 從「告訴你怎麼做」到「替你做」的根本轉變。
// chat-to-action
2024 · Chat Generation

Chat·會說

告訴你「怎麼做」——你還是得自己動手。模型像顧問,你是執行者。
Pattern 使用者問問題,模型回答步驟、建議、思路——但所有的「實作」與「執行」都還在使用者這邊。
2026 · Action Generation

Action·會做

直接替你完成任務——不告訴你怎麼做,而是做給你看。模型是執行者,你是定義者。
Pattern 使用者下目標,模型自主規劃、呼叫工具、產出結果——「實作」與「執行」整段被吃掉。
最大的「啊哈」時刻,是當 Claude 真的可以替你做事的瞬間⋯⋯它可以直接做完。當人們感受到那一刻,那就是真正開眼的時候。 — Cat Wu
Claude Code
Code Outputs
輸出形式:程式碼、commit、PR、測試。
場景:建構、修 bug、重構、做 prototype 直到 production-grade。
Co-work
Non-Code Outputs
輸出形式:簡報、文件、報告、分析。
場景:從 Slack 對話與 Google Drive 資料合成 20 頁 deck,幾秒完成幾小時的工作。
05/05
— Agency > Alignment
Just Do Things · 行動勝過對齊
當週日的 P0 到週一下午就被 P0000 蓋過——僵化角色是死刑。 Anthropic 的座右銘:Just Do Things。這不是口號,是「人類能動性」的明令。
// human-agency
Friday
P1
原本的優先級
Sunday
P0
週末有了新發現
Mon AM
P00
早會冒出更急的
Mon PM
P0000
下午整個翻盤

在這種環境裡,「等對齊完才動手」就是輸——所以 Anthropic 的 PM 必須具備真正的 agency:自己判斷、自己起手、自己對結果負責。模型還寫不了的最後一塊,就在這裡:

Models Can ✓

機器擅長的事

  • 寫程式、產生 PR、跑測試
  • 合成 20 頁 deck、寫文件
  • 分析資料、跑 eval
  • 整理 Slack 對話成摘要
  • 批次自動化重複工作
Models Can't ✕

仍是人類專屬

  • 讀懂 CEO 的微妙偏好
  • 選對溝通高風險轉折的場合
  • Tacit Common Sense(隱性常識)
  • 跨部門 Stakeholder 管理
  • 無情優先排序、預防團隊 burnout
Conclusion · 逃離歷史的 backlog

Stop managing the backlog · start automating

01

把雜事自動化到 100%

不要停在「90% 的 cool prototype」。把最後一哩走完——做到使用者真的能脫手。這才解放「人類能動性」去做別的事。

02

把 Eval 內化成肌肉

每個 PM 都該寫得出 10 個好 eval。不能量化的 Golden Path 不算管理產品——只是用 prompt 賭博。

03

用 Just Do Things 取代等對齊

P0 變 P0000 的世界裡,對齊完才動手就是輸。自己判斷、自己起手、自己對結果負責——這才是現代 PM 的存在意義。

AI 不只是一個工具來優化你目前的工作流——它是一個徹底重新發明你職業存在的理由。
你要花生涯管理「歷史的 backlog」,還是要建立讓你能專注未來的自動化?
Further Reading 延伸閱讀