AI 代理引發的AI伺服器架構重塑,由GPU為中心轉向CPU-GPU偕同

2026.05/21

|

產業趨勢探勘

AI 代理引發的AI伺服器架構重塑,由GPU為中心轉向CPU-GPU偕同

  1. 從生成式 AI邁向 AI 代理時代,讓晶片底層的算力配置迎來了重塑。根據 TrendForce 最新預測,過去在模型訓練期,伺服器內部的CPU與GPU配置比約為 1:8;然而進入需要全天候持續推論、自主規劃與工具調用的代理人時代,為了消除邏輯調度的嚴重瓶頸,這個比例正快速翻轉為 1:2 甚至 1:1。這項結構性配比的改變意味著在同等規模的運算叢集中,CPU實體需求量直接激增了 4 倍。
  2. 生成式AI 核心是海量數據的矩陣乘法,因此GPU 的並行運算架構是絕對主力。然而,AI 代理需要進行思考—行動—觀察的連續思維鏈運算,涉及大量的條件判斷、邏輯推理與決策分支。這類純標量運算是 CPU 的絕對強項,GPU 在處理這類序列邏輯時效率極低。
  3. 消除 GPU 空轉瓶頸需要重估運算叢集的整體 ROI,在1:8的舊架構下,當 AI 代理在推論模型與系統邏輯之間來回頻繁切換時,若 CPU 處理邏輯的速度跟不上,就會導致昂貴的 GPU 處於等待指令的閒置狀態。因此將配比拉升至 1:2的核心目的在於用 4 倍的邏輯大腦去餵飽加速器,消除系統級的調度延遲,極致化企業的算力投資回報率。
  4. AI代理具備獨立呼叫外部 API、搜尋網路、讀寫資料庫,甚至直接控制物理設備的能力。這些「行動」會產生大量且碎片化的作業系統指令、網路通訊協定與系統中斷。這類底層的系統級碎片化任務,無法透過並行算力加速,必須由 CPU 統一進行強大的排程與執行。
  5. AI代理連續式的持續決策,要求極短的延遲時間。LPU專攻極速Token的生成,憑藉著打破傳統SRAM與記憶體頻寬極限的序列運算架構在雲端與地端的高階推理市場迅速擴張,蠶食了部分通用 GPU 的推理市佔。
  6. NPU 確立邊緣端常駐感知的能效統治力,在Always-on的物理 AI 邊緣設備中(如無人機、工控感測器),算力必須受到嚴格的功耗限制。NPU 確立了其在多模態感知融合(視覺、語音、環境感測)上TOPS/W(每瓦算力)的統治地位,負責在最低功耗下維持邊緣代理人的感官待命。
  7. 當算力單元從 GPU 獨大演變為 CPU、GPU、LPU、NPU 四方協同,晶片與晶片之間的交通密度呈現暴增。如何讓 1:2 架構下的 CPU 與加速器實現零延遲互連,直接帶動了高速傳輸介面 IP 與新一代總線架構的規格升級。

 

電力即算力,CPU 四倍增長帶動功率半導體的結構性紅利

  1. 算力結構的翻轉也重塑了供電架構。CPU數量激增了4倍,代表伺服器與主機板內部需要多出 4 倍的獨立核心供電路徑,將帶動功率半導體大幅的增量。
  2. 過去伺服器的供電設計重心 90% 在GPU端,CPU僅需一組相對簡單的電壓調節模組(VRM)。但在1:2的高密度配置下,CPU的數量增加了4倍,且CPU與 GPU的電源供應屬於獨立路徑,這導致單張板卡上的 VRM 迴路數量以指數級的暴增,也直接帶動 MOSFET 與電源管理 IC的消耗量大幅上修。
  3. 為了應對AI代理複雜的思維鏈運算,下一代企業級CPU熱設計功耗正大幅邁向 500W 以上,核心電壓極低但供電需求卻高達1,000A。這種極端的大電流環境,需要多相數位供電架構來均攤電流,大幅增加了高階高頻功率元件的導入比重。
  4. 頻繁任務的切換將是對瞬態響應的嚴苛考驗,與GPU穩定的矩陣渲染不同,AI代理的運作邏輯是思考—工具調用—再思考,這導致 CPU 的負載會在微秒之內於極低功耗與瞬間滿載之間劇烈切換。這種頻繁的電流波動會引發嚴重的電壓雜訊,功率元件必須具備極低的導通電阻與極速切換能力,否則晶片會因電壓不穩而降頻或當機。
  5. 隨著 4 倍CPU密度帶來了機櫃總功耗的暴衝,傳統 12V 供電會因電流過大而在銅箔線路上產生災難性的電阻熱損耗。促使系統必須全面改採 48V 甚至 400V 的高壓直流供電架構。在這種高壓轉低壓的動態過程中,傳統矽基元件因切換損耗過大已達物理極限,GaN與SiC等第三代半導體功率元件就成為唯一生存之道。
  6. 在過去的 AI 伺服器中,功率半導體僅佔整體 BOM 物料清單成本的極低比例。但在2026年1:2架構下,由於獨立供電路徑翻倍、千瓦級超大電流管理、以及第三代半導體材料的剛需導入,單片算力板卡上的功率半導體與電源管理晶片的總產值呈現 3 到 5 倍的階躍式跳升,徹底改變了功率元件廠商的獲利結構,單片板卡功率半導體價值量會有階躍式的提升。
  7. 4 倍CPU與高負載運算所帶來的巨大熱能讓水冷風扇與幫浦的耗電量同步飆升。散熱系統內部各類刷馬達驅動 IC與相關高階功率半導體,已從邊緣配件晉升為確保處理器不被熱降頻的關鍵零組件。

 

GoldON 投資方向思考

AI 四大算力單元的秩序重整帶來CPU的重生

  1. 2026 年的 AI 投資已經產生質變,正從盲目追求單一GPU算力轉向CPU、GPU、NPU和LPU的偕同。
  2. 當代理AI 讓每家公司都擁有全天候運行的私有執行軍團時,LPU 負責決策速度、NPU 負責邊緣感知、GPU 負責內容生成,而激增 4 倍的CPU則將是掌握全局的安全與調度大腦。
  3. 這種趨勢下,能解決邏輯調度瓶頸與硬體電力牆的晶片供應鏈將最有成長價值。特別是掌握 CPU 命脈的矽智財廠(如力旺、晶心科),以及在獨立供電路徑中具備剛性換代需求的功率半導體族群(如富鼎、漢磊、嘉晶、茂達)。
  4. 將世芯、創意、茂達、力士、富鼎、漢磊與嘉晶逐一拆解後,可以發現 1:2 架構翻轉對個別公司的獲利推動力存在顯著的質變。各雲端巨頭推進自研CPU,帶給世芯與創意的先進ASIC合約產生營收爆發力,同時地端私有代理人工作站普及,讓功率半導體族群(富鼎、漢磊、嘉晶、茂達、力士)在核心供電元件上量價齊揚。

 

AI伺服器架構秩序重整下的台灣晶片供應鏈

  1. 矽智財

力旺

  • 代理人具備自主呼叫 API 與金流行動的權限,每顆 CPU 必備硬體信任根。隨著 CPU 核心數翻倍,其 PUF 安全 IP 授權與權利金將迎來指數級增長。

晶心科

  • 代理AI全天候運作需要高彈性、低功耗的核心,系統廠為優化 1:2 架構,大量導入晶心科可客製化指令集的 CPU 核心。

M31

  • 負責處理 CPU、GPU 與 LPU 之間 1:1 高速數據傳輸的物理層介面 IP(PCIe Gen 6/7、UCIe),直接受益於晶片間交通密度的暴增。

信驊

  • 運算節點從 1:8 走向 1:2,代表單一系統內的運算節點數大幅膨脹,每組節點必備 BMC 晶片,出貨量將隨之爆增。
  1. IC 設計與自研晶片服務

世芯

  • 長期與北美超大型雲端巨頭深度綁定,是這些巨頭在推進自研 LPU、客製化推理晶片與高效能運算節點時的首選 ASIC 合作夥伴。
  • 手握台積電 3 奈米與 2 奈米的頂尖設計案件,具備在極致高功耗環境下進行異質整合(Chiplet)的物理層設計能力。
  • 在1:2架構下,世芯不僅提供加速器晶片設計,更能協助客戶將高核心數自研 CPU 與專用推理單元進行底層傳輸優化,大幅削減代理人思維鏈的通訊延遲。

創意

  • 作為台積電價值鏈聚合聯盟(VCA)的核心成員,在先進封裝產能極度緊缺的時局下,具備優先獲取產能的絕對優勢,確保LPU與HBM整合晶片的順利量產。
  • 在CPU與加速器配比翻轉的高速互連浪潮中,創意手握自主研發的 HBM3/4 實體層(PHY)與 UCIe(小晶片互連)IP,因不需外購,能顯著推升單個專案的毛利率。
  • 除了雲端大算力加速器外,廣泛佈局全球網通巨頭與大型企業級高速 CPU 的客製化設計,在 CPU 超級週期中,擁有比同業更多元的營收增長引擎。

聯發科

  • 率先將終端高效能CPU、NPU 與通訊深度整合。隨著 Physical AI 滲透至汽車與邊緣設備,聯發科憑藉均衡的異質整合能力,掌握了邊緣代理人平台的定義權。
  1. 功率半導體與電力管理

茂達

  • 長期深耕 CPU 核心PMIC,在台廠中具備技術領先,將完全受惠於伺服器與地端工作站 CPU 密度提升 4 倍的數量紅利。
  • AI 代理在執行連續決策時CPU負載會產生劇烈的高頻切換。茂達的高階 PMIC 具備極速的瞬態響應能力,能確保 CPU 瞬間滿載時電壓不產生雜訊與降頻。
  • 在高階PC與筆電CPU供電市佔率極高,當 Claude Code 與 OpenClaw 帶動地端私有工作站與高階 AI PC 換機潮時,其ASP與出貨量將迎來大幅調升。

力士

  • 在處理器 VRM 的最後一哩路中,力士的高階中低壓 MOSFET 以極低的導通電阻著稱,能大幅削減 CPU 數量翻倍後帶來的板卡散熱壓力。
  • 利用獨家專利架構,在頻繁切換的代理人微任務中,提供優異的瞬態電流反應,防止主機板在 CPU 頻繁動態喚醒時發生電流不穩。
  • 已成功打入全球地端 AI 加速卡與工作站供應鏈。隨著企業為保護數據隱私,而大量在地端佈署私有代理人叢集,力士的MOSFET 使用量呈 3-5 倍的剛性爆發。

富鼎

  • 透過與晶圓廠深度戰略合作,成功開發出全新製程的高壓 MOSFET 新品,擺脫隨波逐流的二線標籤,具備與國際頂尖 IDM 大廠在通訊與高階工業能源領域硬碰硬的競爭實力。
  • 高功率 AI 伺服器帶動水冷及風扇系統高標運行,富鼎的功率元件已成功獲得台系散熱龍頭與日系大廠青睞導入,在風扇產品營收比重顯著拉升。
  • 在供應鏈安全與本土化生產成為核心訴求的當下,富鼎作為鴻海集團轉型資料中心與高端電力網路的戰略功率元件主力,正經歷從 PC 級產品到資料中心伺服器級的市場評價重估。
  1. 功率半導體與電力管理

漢磊

  • 作為寬能隙代工的先驅者,漢磊已成功在伺服器高壓直流電源、工業機具等領域確立技術門檻,完整承接傳統矽基元件無法負荷的高頻高高壓代工訂單。
  • 引進世界先進戰略投資,聯手強攻 8 吋 SiC晶圓製造。隨產能建置與製程推進,不僅成本與價格將具備對 6 吋晶圓的絕對競爭力,更完美鎖定未來 AI 資料中心之關鍵供電。
  • 受惠於 AI 代理常駐化以及人形機器人等新應用大規模導入,其GaN與 SiC 客戶急單效能顯著。產能利用率提升,化合物半導體成為 2026 年最強勁的獲利引擎。

嘉晶

  • 作為上游核心材料供應商,其 8 吋 SiC 磊晶製程與 8 吋 GaN 磊晶研發已通過客戶驗證,並陸續小量量產,在 AI 伺服器全面導入 800V 高壓直流供電架構的時代,掌握了材料剛性需求的最高位階。
  • 因應高階矽磊晶及矽光子進展超乎預期的快速,大幅追加3倍的資本支出,全力擴充大尺寸、高產值的磊晶產線,展現強烈轉型爆發力。
  • 與漢磊形成磊晶+代工的緊密垂直整合,由於底層材料的純度直接決定了整座 AI 資料中心的能源使用效率。在面對外部地緣局勢或原料波動時,具備轉嫁成本與獨立調整產品價格的護城河。

 

閱讀更多前驅投資文章

https://goldoninvest.com/

關於本篇

前驅投資週報2026-002

Processor: Shawn Hung