Arm CEO与黄仁勋同台:Windows+Arm生态已就位,联手“重新定义PC”,AGI CPU正式量产
发布时间:2026-06-02 18:35 浏览量:1
Arm在Computex 2026正式宣布AGI CPU进入量产阶段,押注Agentic AI时代数据中心对CPU算力的爆发性需求,并由此确立了向自研芯片领域的战略转型。
CEO Rene Haas表示,此前设定的150亿美元自研芯片营收目标"有望提前实现"——"需求比我们预期的还要强劲,需求表现非常好"。该目标原定于本十年末完成,届时自研芯片业务营收预计将超越现有IP授权业务规模。
Arm股价周一大涨逾15%,收报408.85美元,创历史收盘新高,年内涨幅累计达274%,过去12个月累计上涨224%。英伟达发布RTX Spark笔记本芯片——该产品集成Arm定制版Grace CPU,搭载20颗Arm架构核心,并配备专为智能体计算设计的Blackwell GPU,宏碁、华硕、戴尔、技嘉、惠普、联想、微星、微软等主流PC厂商均已确认推出对应机型。
Rene Haas直言,“常年不断有人咨询:Windows+Arm生态何时能在笔记本、通用计算领域形成规模化竞争力?我的答案是:如今这个节点已经到来。”黄仁勋则表示,“打造智能体设备离不开高性能CPU,这也是我们选用Arm架构的核心原因。产品搭载20核CPU,单核性能优异。”
与此同时,Arm AGI CPU正式宣布进入量产阶段,meta、OpenAI、Oracle Cloud Infrastructure等头部AI及云端企业相继加入该产品生态。
AGI CPU量产:以能效优势切入数据中心CPU市场
Arm AGI CPU定位Agentic AI快速成长带来的数据中心CPU增量需求,目前提供气冷与液冷两种系统配置。气冷机柜功耗约36千瓦,搭载8000个核心;液冷机柜功耗约200千瓦,搭载超过45000个核心。Rene Haas表示,在相同机柜功耗下,Arm AGI CPU的性能约为竞争架构系统的两倍,意味着数据中心可在相同电力条件下获取更高算力,或在降低功耗的同时维持具竞争力的性能表现。
Rene Haas在主题演讲中阐述了Agentic AI推升CPU需求的底层逻辑:GPU与XPU擅长训练与推理,可视为token生成器;但AI Agent持续运行且会不断启动新的Agent,后端随之产生大量token分配、管理、协调与传送任务,这些系统层级工作负载仍须由CPU承担。他指出,
Arm此前预估未来在相同功耗范围内数据中心可能需要4倍CPU核心数,而市场目前讨论的倍数已涵盖4倍、8倍乃至10倍等不同估算。
在市场规模层面,Arm曾估计未来五年CPU市场规模可能达到1000亿至1200亿美元以上,
Rene Haas表示随着AI Agent应用持续成长,市场讨论的规模数字甚至已超过原先预测。
他以约10GW容量的数据中心测算,导入更高每瓦效能的CPU方案后,可带来最高100亿美元量级的成本节省。
RTX Spark重塑AI PC格局,Arm生态系统壁垒凸显
英伟达CEO黄仁勋亲赴主题演讲台,与Rene Haas对谈,阐述RTX Spark的产品定位。黄仁勋表示,
英伟达的目标是重新定义个人电脑,
PC问世已有四十年,过往手写开发的系统软件将逐步被各类智能体应用替代,这一图景驱动英伟达重构硬件架构与操作系统。他指出,
打造智能体设备离不开高性能CPU,这是选用Arm架构的核心原因,Arm的定制化能力可灵活适配整机设计需求。
产品层面,RTX Spark标配128GB内存,基于英伟达自研NVFP4数值格式压缩,本机可常驻千亿参数级大模型以满足日常运算,复杂推理任务对接云端算力。黄仁勋还透露,奥多比已宣布重构Photoshop、Premiere,接入CUDA加速并适配智能体调用,Blender、欧特克、达索、西门子等行业软件亦将陆续完成RTX硬件加速适配。
Rene Haas在演讲中指出,当前Linux、全系苹果macOS、Chrome OS、Windows均已完成Arm平台适配,全系统兼容能力仅有Arm可以实现,是Windows+Arm生态在笔记本与通用计算领域形成规模化竞争力的重要基础。他表示,这一节点已经到来,离不开与苹果、谷歌、微软数十年的持续合作。
客户阵营持续扩大,利益冲突质疑获正面回应
Arm AGI CPU已获得meta、Rebellions、SAP、Cerebras、OpenAI等企业支持,甲骨文近期亦宣布加入该生态。
Rene Haas在演讲中正面回应了外界对Arm自研CPU是否与现有IC设计客户产生利益冲突的质疑。他表示,该项目的驱动力来自客户主动提出需求,而非Arm主动切入竞争——"是客户要求我们做出这个产品,而不是我们主动跨入这块市场。"他披露,meta早在两年前便向Arm提出需求,彼时市场上几乎没有基于Arm架构的服务器芯片可用选项。
Rene Haas强调,目前AI运算芯片的需求远大于供给,Arm AGI CPU与英伟达产品的订单均极为强劲,现阶段尚未出现自有产品对既有客户形成排挤效应的情况。他以3月24日发布会上多家合作伙伴公开提供正面引述与见证视频为佐证,表示重要合作伙伴事前已获充分沟通。
市场展望:分析师看多x86与Arm两端需求并存
Mizuho分析师Vijay Rakesh在研报中对Arm和AMD均维持"跑赢大市"评级,对英特尔维持"中性"评级,称"在整体强劲前景下,我们继续看到x86和Arm平台在2026年下半年至2027年均受益于强劲的CPU需求增长"。
独立分析师Richard Windsor则在其Radio Free Mobile博客中写道,若AMD宣布推出基于Arm架构的CPU,这将是其放弃x86架构的信号,届时"现实将变得无法忽视"。
在供应链层面,Rene Haas在Computex期间向媒体表示,包括高带宽存储芯片、DRAM和NAND在内的各类存储芯片供需平衡均处于紧张状态,由于此前下行周期中产能扩张不足,存储芯片仍是目前最难解决的瓶颈,未来一段时间内供应整体仍将保持紧张。
以下为演讲实录,部分内容有删减:
Arm首席执行官Rene Haas:
大家好,欢迎各位到场。
每逢六月就迎来中国台北电脑展(COMPUTEX),六月的中国台北午后与晚间气候闷热,但能再次回到这里,我倍感欣喜。
放在以往,很多事看似相隔久远,但身处当下人工智能飞速发展的时代,行业迭代速度近乎以光年计。
今年3月24日我们举办了名为“Arm无处不在”的主题发布会。
当时我们重点研判智能体与智能体人工智能的行业增长趋势。
就在3月24日的活动现场,我们展示了一张数据幻灯片,对比OpenClaw项目相较于Linux、Kubernetes的增速变化。图表左侧为GitHub项目收藏星标数量,星标数值直观反映一款应用的受欢迎程度与用户粘性。
彼时3月的数据就显示,OpenClaw项目的用户增长呈现近乎指数级的爆发态势。
这一数据变化向我们传递一个信号:各类智能体平台的高速发展,正在催生前所未有的中央处理器(CPU)需求。
背后逻辑十分清晰:图形处理器(GPU)、异构处理器(XPU)擅长生成Token,这也是这类加速芯片的核心定位。
无论是模型训练生成学习参数,还是推理环节输出Token,Token生成的核心载体都是各类硬件加速器。
但智能体和人类不同,没有休息周期,智能体会持续衍生出新的子智能体,子智能体又会继续繁衍。
海量Token的分发、调度、统筹、下发落地,全部依赖CPU完成相关算力负载,同时CPU需要搭配整套系统架构协同工作。
基于以上逻辑,我们在3月24日的发布会上率先提出预判:
未来同等功耗约束下,市场所需
CPU
核心数量将增至现有四倍,我们也是业内较早提出该观点的企业。
四倍这个系数发布后,大量业内人士向我们求证测算逻辑与数据来源。此后行业陆续出现四倍、八倍甚至十倍的相关增长预判。受智能体发展速率影响,精准数值很难敲定。
但有几点趋势可以确定。
从3月24日至今,智能体产业的增长速度持续突破预期,呈现爆发态势。
雪花数据(Snowflake)、赛富时(Salesforce)、ServiceNow等SaaS服务商,都在研发可在后端运行的各类智能体应用。
Anthropic旗下Claude代码模型、OpenAI的Codex模型落地,层出不穷的智能体算力需求持续推高CPU采购量。
进而带动CPU市场迎来高速增长。
如果把纵坐标统计口径更换为硬件出货量,从增长曲线可以看出,CPU行业增速已经超出我们此前预估。
这是全行业的共性趋势,并非Arm一家独有。
后续我会进一步介绍Arm相关产品,目前整个CPU赛道所有厂商都面临需求暴涨的现状。
智能体不断迭代繁衍,直接带动CPU需求持续井喷。
最终需求涨幅究竟是四倍、六倍还是八倍,我们无法精准定论,但可以确定增长系数仍在持续走高。
智能体产业加速扩张,同步拉动CPU市场规模持续攀升。
3月24日我们给出预测:
五年内全球
CPU
整体潜在市场规模(
TAM
)将突破
1000
至
1200
亿美元。
发布会举办当时,不少媒体、投资机构、行业分析师都表示该预测数值过于激进,质疑测算依据。
时隔不久,当前行业给出的市场预测数值,已经接近我们当初预估数值的两倍甚至更高。
核心驱动逻辑在于:AI智能体算力负载下,Token生成量越高,数据处理体量越大,智能体智能化程度越高,对应算力消耗也就越高。
针对该市场需求,我们推出了对应解决方案:Arm通用人工智能(AGI)架构处理器。
正如之前所说,这款处理器全系在中国台湾生产。接下来我再次播放3月24日发布会展示过的产品宣传片,既方便没看过的观众了解产品,我个人也十分喜爱这支短片。
我几乎每天都愿意回看这支视频,每次观看都备受鼓舞。
Arm AGI处理器落地中国台湾量产,合作伙伴台积电已经协助我们实现产品量产。
我们此前定下产品发布准则:在敲定终端客户、产品正式出货、拥有落地合作伙伴前,不对外详细披露产品细节。
在当前产业环境下,芯片落地不能只依靠单款硬件,需要联合合作伙伴打造整套全栈解决方案。
我们在中国台湾集结了全球顶尖的产业链合作伙伴。
现场展区就能看到部分合作厂商产品,据了解超微(Supermicro)还在展区摆放了完整服务器机柜。
华擎、晶圆代工伙伴台积电、广达、Insycle、超微、智邦(ASPEED)等优质合作伙伴,依托完善生态助力我们落地高性能产品方案。
从系统形态划分,这款产品分为两大版本。
Arm AGI处理器主打极致性能、高密度集成与高能效表现,能效优化也是Arm的标志性优势,该基因源自早年移动端芯片研发。
早年我们定制移动端处理器时,就要在小型塑封封装内实现电池供电运行,这套研发思路深深烙印在工程师的产品设计中,最终落地为高竞争力产品。
产品两款机型参数:风冷机柜功耗36千瓦,搭载8000颗处理器核心;液冷机柜功耗200千瓦,核心数量超45000颗。
两套差异化方案的核心优势在于单机柜算力、单位功耗算力表现。同等功耗条件下,单机柜算力是同规格X86架构设备的两倍;若想要持平算力,整机功耗仅需竞品一半,能效优势突出。
放眼全球大型数据中心建设,相关合作消息几乎每日都有披露,就在近期,Arm母公司软银官宣在法国投资建设一座总功率5GW的数据中心。
大型数据中心前期资本投入高昂,常年电费成本支出巨大。依托Arm产品单机柜算力强、功耗低的优势,能够大幅降低数据中心综合投入。
经我们测算,规模化部署后可支撑约10GW算力需求,帮助客户节省近百亿美元成本;未来随着处理器装机量持续提升,降本收益还会进一步放大。
3月发布会时我们就公布了首批落地合作客户:meta、Rebellions、思爱普(SAP)、Cerebras、OpenAI、韩国SK Telecom。
时隔数月,又有多家企业加入合作名单:甲骨文(OCI业务长期和Arm深度合作)等。
两家新伙伴的落地,印证Arm AGI处理器能够切实解决行业实际算力痛点。
这里我再次强调:如今Arm已经转型全栈端到端解决方案供应商。
虽然Arm AGI处理器已经实现量产,但并非所有客户都愿意直接采购成品芯片,对此我们也提供多元化合作模式。
客户既可以采购整套计算子系统,也能单独采购架构知识产权(IP)。谷歌、亚马逊、英伟达、微软等众多头部企业都选择IP授权合作模式,我们会按照客户需求灵活定制解决方案。
伴随智能体AI产业爆发,无论是自研成品处理器,还是对外输出IP与子系统,Arm整体业务增长势头迅猛。
上个月谷歌重磅官宣:TPU 8t、TPU 8i两款加速芯片配套主控CPU,将从原有X86架构切换为自研Axion处理器,该芯片基于Arm Neoverse架构打造,同等性能下功耗降低60%。
亚马逊CEO安迪·贾西在财报电话会议中提到,不少合作方希望全额买断亚马逊Graviton架构相关产能。如今亚马逊超半数全新服务器项目选用Graviton替代X86,而几年前该比例还是零。英伟达全新Vera产品同样选用Arm方案,是我们重要的合作伙伴。
Vera产品综合实力出众,实际合作厂商名单远超现场展示内容,幻灯片版面无法尽数罗列。目前Vera相关业务增长势头强劲。
我们对Arm AGI处理器有着长期规划,产品采用多代迭代路线,第二代Arm AGI处理器研发工作已经启动,新品核心数量更多、能效与性能进一步优化;第三代产品也在筹备阶段。
全系列产品依托自研计算子系统(CSS)落地,我们同步向合作伙伴输出该套子系统,既赋能合作方自研硬件,也支撑自有处理器迭代,全系列产品保持统一迭代周期。
以上就是增长势头强劲的Arm AGI处理器相关介绍。
接下来切换话题。二十多年前我第一次参加中国台北电脑展,早年展会集中在老展馆,展区随处可见软盘控制器、USB线材,周边电脑城品类齐全。
当时的电脑城一栋十层建筑内,一层就能聚集数十家配件商铺,堪比巨型连锁电脑卖场Fry's,消费者可以在店里买到各类电脑配件,这也是当年台式电脑主流选购方式。
早年PC整机的组装、选购模式十分有趣,产品价格覆盖全价位区间,从入门级便携上网本,一直到高端电竞主机,产品售价按50美元档位划分。
在场还记得上网本的朋友可以举手,英伟达的同仁肯定深有体会,我们都经历过那个产品周期。
产品在主频、内存容量等硬件参数上做差异化,各厂商争抢细分市场份额。
时至今日行业变化巨大,不仅PC选购模式彻底改变,产品使用场景也因智能手机、互联网、各类应用软件出现迎来颠覆性升级。
当下PC产品逐步分化为两大产品方向。
第一类是便携生产力设备:续航优异、全场景互联,形态近似大屏带键盘手机,使用逻辑和智能手机高度互通。我本人就在使用折叠屏产品,日常用来审阅文档、修改演示文稿;作为企业高管,我日常文稿创作不多,以审核工作为主。
我经常在折叠便携设备和传统PC之间切换使用,设备间数据、应用高速同步是刚需。
第二类是超高算力机型,用于智能体部署、大模型运行、程序开发等重度负载场景,对硬件性能要求拉满。而Arm是唯一可以同时支撑两条产品路线的架构。
早年PC行业靠丰富价位、差异化硬件参数瓜分市场,如今产品聚焦两大极致赛道:一端主打超长续航与轻量化AI体验,另一端主打智能体超高算力,两条赛道Arm全部适配。
宏碁相关产品、苹果Mac Neo、谷歌Chromebook、微软Surface、Mac Studio以及英伟达刚发布的RTX Spark,都是对应两大赛道的代表机型,而这些产品全部依托Arm生态落地。
常年不断有人咨询:
Windows+Arm
生态何时能在笔记本、通用计算领域形成规模化竞争力?我的答案是:如今这个节点已经到来。
当前Linux、全系苹果macOS、Chrome OS、Windows系统全部完成Arm平台适配,全系统兼容能力仅有Arm可以实现。这份成果离不开各大操作系统厂商的深度协同,我们和苹果、谷歌、微软数十年持续合作,生态搭建绝非一朝一夕之功。
在此感谢所有合作伙伴助力生态落地。
接下来介绍英伟达新品RTX Spark笔记本,该产品采用Arm架构,我们是英伟达本款产品的核心合作方。
产品搭载定制版Grace CPU,内置20颗Arm架构核心,是目前市面笔记本处理器核心数量的天花板。搭配专为智能体运算打造的Blackwell旗舰GPU,产品综合实力出众。
硬件可实现FP4精度下1PFlops算力、超大内存容量,原生预装Arm版Windows系统。
宏碁、华硕、戴尔、技嘉、惠普、联想、微星、微软均已确认推出对应机型,微软全新Surface Ultra就是标杆产品。在此祝贺英伟达团队顺利落地这款产品。
本项目落地过程中,我们依托自研计算子系统(CSS)方案,和英伟达、联发科深度协同。
简单解释计算子系统:CSS是定制SoC开发的模块化基础组件,涵盖CPU、配套GPU、系统IP、内存控制器等芯片全部组成模块,我们将整套组件打包对外供货。
联发科既可以选用整套完整解决方案,也能按需采购零散模块化组件。依托IP+计算子系统的商业模式,Arm在PC智能体算力赛道迎来广阔机遇,产品落地逻辑和AGI服务器处理器一脉相承。
正如前文所说,未来PC行业发展前景广阔:一端是我日常办公使用的轻量化创作设备,另一端是支撑智能体交互、大模型运算的高端算力主机,两大细分市场空间全面打开,英伟达RTX Spark已经印证该产品路线的可行性。
与黄仁勋的互动Rene Haas:接下来我邀请一位重磅嘉宾上台,一同深入聊聊RTX Spark以及英伟达整体布局。
黄仁勋:谢谢。
Rene Haas:Arm架构适配Windows早已不是新概念,为什么这款产品能实现差异化突破?每次你发布新品,你们公司股价大涨,反观我这边毫无波动。
黄仁勋:客观来说我对此乐见其成,顺便说明,你曾经持有我方股票并且已经变现。
Rene Haas:没错,我当时需要现金流周转。咱们言归正传,聊聊RTX Spark,这次产品的革新之处在哪?
黄仁勋:
我们想要重新定义个人电脑。
PC问世已有四十年,过往手写开发的系统软件,未来会逐步被各类智能体应用替代。智能体AI依托PC硬件、调用PC内置工具运行,基于这套未来图景,我们着手重构硬件架构与操作系统,实现电脑产品革新。
打造智能体设备离不开高性能CPU,这也是我们选用Arm架构的核心原因。产品搭载20核CPU,单核性能优异;为容纳海量大模型参数,我们自研MVFP-4数值格式,压缩大模型体积,让超大参数AI模型可以装进设备本地内存。
我们同时整合用于通用加速计算的CUDA、面向张量核心运算的CUDA Tiles至单颗处理器。智能体自主思考、调用工具时响应速度极快,因此配套工具必须同步提速。
奥多比官宣重构Photoshop、Premiere软件,产品接入CUDA加速、适配智能体调用;Blender、欧特克、达索、西门子等行业软件都会陆续完成RTX硬件加速适配,全品类工具加速落地后,即可快速响应智能体指令。
想要落地这款片上系统(SoC),需要CPU厂商灵活定制架构、深度适配整机设计,Arm的定制化能力完美契合我们的需求。
Rene Haas:感谢分享,接下来聊聊本地部署智能体和云端智能体的取舍问题,长期来看两种模式会如何演变?
黄仁勋:不客气。未来个人电脑本身就会变成全天候自主运行的智能体。如今出门忘带笔记本就无法使用设备,未来只需要通过手机和本机智能体对话,远程操控PC完成任务,比如快速起草发言稿。PC在闲置时段依旧在后台持续运算。
需要调用云端接口的任务走云端算力,能够本地完成的运算全部在PC端落地,这也是个人终端产品的核心属性:本地算力任务自主处理,不用担忧计费与时长,跨域复杂需求再联动云端。
Rene Haas:伴随大模型迭代,PC硬件性能与架构能否持续扩容?贵司Blackwell、Rubin系列产品已经交出亮眼答卷,软硬件如何协同实现算力扩容?
黄仁勋:RTX Spark标配128GB内存,依托NVFP4格式压缩,本机可常驻千亿参数大模型(例如Nemotron 3 Super),满足日常基础运算;前沿复杂推理任务随时对接云端算力。
Rene Haas:本地大模型普及会改变传统端云算力配比吗?未来云端算力需求会缩减还是继续走高?
黄仁勋:智能体体系包含主智能体、多层级子智能体,算力分布兼顾云端与终端,和当下移动互联网逻辑一致,移动端和云端缺一不可。兼顾本地算力与云端资源,才能打造优质个人智能体验。
Rene Haas:有个颇具探讨性的问题:智能体在后台自主处理大量工作后,操作系统还有存在的必要吗?未来智能体本身会不会替代操作系统?
黄仁勋:操作系统的重要性只增不减。不少人鼓吹AI到来后软件行业消亡,实际恰恰相反:智能体运行的基础是各类应用软件,智能体需要调用Photoshop、Pr、Canva、西门子工业软件等海量工具,而所有软件都依托操作系统运行。智能体通过读取软件使用手册、调取程序接口,完整解锁软件全部隐藏功能,倒逼软件价值提升,Windows等操作系统在很长周期内都是刚需。
Rene Haas:英伟达深度布局AI全产业链,覆盖算力、网络、整机全环节,从贵司视角来看,未来数年行业增长瓶颈集中在哪些领域?
黄仁勋:全产业链各环节都存在阶段性约束。产品迭代上,Hopper架构主打模型训练;Grace+Blackwell架构兼顾训练,搭配NV-link72链路优化推理性能。早期行业普遍低估推理难度,实际上混合专家大模型想要高效生成Token,离不开高规格硬件支撑,Grace Blackwell+NV-link72方案实现业内最低Token生产成本,是行业里程碑。
Vera、Rubin系列在上述技术基础上拓展智能体算力场景。两年前我们提出产品适配智能体时业内难以理解,如今行业达成共识:智能体需要自主思考、调用工具、管理长短时内存、索引多格式数据,整套运行逻辑需要全新硬件架构支撑,Vera Rubin就是面向智能体的专用计算平台。
当下智能体已经落地商用创造实际收益,是全行业算力爆发的核心动因:Token生成产生盈利,市场就会无限度扩充Token产能;并且智能体运算负载远高于普通人机对话,算力消耗最高可达闲聊场景的百万倍。智能体单次任务可连续运算数天乃至数周,Token生成需求呈指数暴涨,供需错配造成全产业链算力紧缺。
英伟达提前预判智能体风口、布局供应链,实现连续高增速,今年营收同比近乎翻倍,明年依旧保持高速扩张;即便如此,终端市场需求增速依旧超过产能扩容速度。近期我和行业同仁交流,大家都感慨从未见过半导体行业连续四年处于高景气周期,而从智能体产业基本面来看,本轮行业上行周期仍将延续。
底层逻辑在于:过往计算机用户受限于人类数量,全球仅十亿人使用电子设备;未来数十亿级别的智能体、人形机器人、自动驾驶设备都会接入算力网络,全球算力市场规模有望在现有万亿体量基础上再翻十倍,这也是英伟达市值登顶全球的底层逻辑,如果两家企业合并,市值依旧稳居全球首位。
Rene Haas:这个设想十分美妙,再次祝贺RTX Spark顺利落地。我准备了一份小礼品送给您,这件藏品很有纪念意义:Tegra3是全球首款落地Windows+Arm架构的笔记本芯片。
黄仁勋:不得不说,相比当年,我保养得更好。
Rene Haas:在场各位觉得我说的对吗?礼品送给您,麻烦在藏品上签名留念。
黄仁勋:签完再回赠给我就能形成采购单据,这套流程我很熟悉,不行。
Rene Haas:感谢。欢迎投资收购Arm,我之前就尝试过促成合作。展品里的原型机是早年双方合作的真实项目,相关研发同事都记忆犹新。