AI 代理引發的AI伺服器架構重塑,由GPU為中心轉向CPU-GPU偕同
2026.05/21
|
產業趨勢探勘
AI 代理引發的AI伺服器架構重塑,由GPU為中心轉向CPU-GPU偕同
- 從生成式 AI邁向 AI 代理時代,讓晶片底層的算力配置迎來了重塑。根據 TrendForce 最新預測,過去在模型訓練期,伺服器內部的CPU與GPU配置比約為 1:8;然而進入需要全天候持續推論、自主規劃與工具調用的代理人時代,為了消除邏輯調度的嚴重瓶頸,這個比例正快速翻轉為 1:2 甚至 1:1。這項結構性配比的改變意味著在同等規模的運算叢集中,CPU實體需求量直接激增了 4 倍。
- 生成式AI 核心是海量數據的矩陣乘法,因此GPU 的並行運算架構是絕對主力。然而,AI 代理需要進行思考—行動—觀察的連續思維鏈運算,涉及大量的條件判斷、邏輯推理與決策分支。這類純標量運算是 CPU 的絕對強項,GPU 在處理這類序列邏輯時效率極低。
- 消除 GPU 空轉瓶頸需要重估運算叢集的整體 ROI,在1:8的舊架構下,當 AI 代理在推論模型與系統邏輯之間來回頻繁切換時,若 CPU 處理邏輯的速度跟不上,就會導致昂貴的 GPU 處於等待指令的閒置狀態。因此將配比拉升至 1:2的核心目的在於用 4 倍的邏輯大腦去餵飽加速器,消除系統級的調度延遲,極致化企業的算力投資回報率。
- AI代理具備獨立呼叫外部 API、搜尋網路、讀寫資料庫,甚至直接控制物理設備的能力。這些「行動」會產生大量且碎片化的作業系統指令、網路通訊協定與系統中斷。這類底層的系統級碎片化任務,無法透過並行算力加速,必須由 CPU 統一進行強大的排程與執行。
- AI代理連續式的持續決策,要求極短的延遲時間。LPU專攻極速Token的生成,憑藉著打破傳統SRAM與記憶體頻寬極限的序列運算架構在雲端與地端的高階推理市場迅速擴張,蠶食了部分通用 GPU 的推理市佔。
- NPU 確立邊緣端常駐感知的能效統治力,在Always-on的物理 AI 邊緣設備中(如無人機、工控感測器),算力必須受到嚴格的功耗限制。NPU 確立了其在多模態感知融合(視覺、語音、環境感測)上TOPS/W(每瓦算力)的統治地位,負責在最低功耗下維持邊緣代理人的感官待命。
- 當算力單元從 GPU 獨大演變為 CPU、GPU、LPU、NPU 四方協同,晶片與晶片之間的交通密度呈現暴增。如何讓 1:2 架構下的 CPU 與加速器實現零延遲互連,直接帶動了高速傳輸介面 IP 與新一代總線架構的規格升級。
電力即算力,CPU 四倍增長帶動功率半導體的結構性紅利
- 算力結構的翻轉也重塑了供電架構。CPU數量激增了4倍,代表伺服器與主機板內部需要多出 4 倍的獨立核心供電路徑,將帶動功率半導體大幅的增量。
- 過去伺服器的供電設計重心 90% 在GPU端,CPU僅需一組相對簡單的電壓調節模組(VRM)。但在1:2的高密度配置下,CPU的數量增加了4倍,且CPU與 GPU的電源供應屬於獨立路徑,這導致單張板卡上的 VRM 迴路數量以指數級的暴增,也直接帶動 MOSFET 與電源管理 IC的消耗量大幅上修。
- 為了應對AI代理複雜的思維鏈運算,下一代企業級CPU熱設計功耗正大幅邁向 500W 以上,核心電壓極低但供電需求卻高達1,000A。這種極端的大電流環境,需要多相數位供電架構來均攤電流,大幅增加了高階高頻功率元件的導入比重。
- 頻繁任務的切換將是對瞬態響應的嚴苛考驗,與GPU穩定的矩陣渲染不同,AI代理的運作邏輯是思考—工具調用—再思考,這導致 CPU 的負載會在微秒之內於極低功耗與瞬間滿載之間劇烈切換。這種頻繁的電流波動會引發嚴重的電壓雜訊,功率元件必須具備極低的導通電阻與極速切換能力,否則晶片會因電壓不穩而降頻或當機。
- 隨著 4 倍CPU密度帶來了機櫃總功耗的暴衝,傳統 12V 供電會因電流過大而在銅箔線路上產生災難性的電阻熱損耗。促使系統必須全面改採 48V 甚至 400V 的高壓直流供電架構。在這種高壓轉低壓的動態過程中,傳統矽基元件因切換損耗過大已達物理極限,GaN與SiC等第三代半導體功率元件就成為唯一生存之道。
- 在過去的 AI 伺服器中,功率半導體僅佔整體 BOM 物料清單成本的極低比例。但在2026年1:2架構下,由於獨立供電路徑翻倍、千瓦級超大電流管理、以及第三代半導體材料的剛需導入,單片算力板卡上的功率半導體與電源管理晶片的總產值呈現 3 到 5 倍的階躍式跳升,徹底改變了功率元件廠商的獲利結構,單片板卡功率半導體價值量會有階躍式的提升。
- 4 倍CPU與高負載運算所帶來的巨大熱能讓水冷風扇與幫浦的耗電量同步飆升。散熱系統內部各類刷馬達驅動 IC與相關高階功率半導體,已從邊緣配件晉升為確保處理器不被熱降頻的關鍵零組件。
GoldON 投資方向思考
AI 四大算力單元的秩序重整帶來CPU的重生
- 2026 年的 AI 投資已經產生質變,正從盲目追求單一GPU算力轉向CPU、GPU、NPU和LPU的偕同。
- 當代理AI 讓每家公司都擁有全天候運行的私有執行軍團時,LPU 負責決策速度、NPU 負責邊緣感知、GPU 負責內容生成,而激增 4 倍的CPU則將是掌握全局的安全與調度大腦。
- 這種趨勢下,能解決邏輯調度瓶頸與硬體電力牆的晶片供應鏈將最有成長價值。特別是掌握 CPU 命脈的矽智財廠(如力旺、晶心科),以及在獨立供電路徑中具備剛性換代需求的功率半導體族群(如富鼎、漢磊、嘉晶、茂達)。
- 將世芯、創意、茂達、力士、富鼎、漢磊與嘉晶逐一拆解後,可以發現 1:2 架構翻轉對個別公司的獲利推動力存在顯著的質變。各雲端巨頭推進自研CPU,帶給世芯與創意的先進ASIC合約產生營收爆發力,同時地端私有代理人工作站普及,讓功率半導體族群(富鼎、漢磊、嘉晶、茂達、力士)在核心供電元件上量價齊揚。
AI伺服器架構秩序重整下的台灣晶片供應鏈
|
|
|
力旺 |
|
|
晶心科 |
|
|
M31 |
|
|
信驊 |
|
|
|
|
世芯 |
|
|
創意 |
|
|
聯發科 |
|
|
|
|
茂達 |
|
|
力士 |
|
|
富鼎 |
|
|
|
|
漢磊 |
|
|
嘉晶 |
|
閱讀更多前驅投資文章
關於本篇
前驅投資週報2026-002
Processor: Shawn Hung

