时隔九个月!OpenAI首颗自研AI芯片叫“辣椒”,但无法替代英伟达
发布时间:2026-06-25 16:50 浏览量:1
就在刚刚,OpenAI与博通联合研发的首颗自研芯片正式发布:
Jalapeño。
他们真的给一颗 AI 推理芯片起名叫“墨西哥辣椒”。
这种命名上的轻佻其实是个信号。
实际上,OpenAI 还没有把自己当成一个芯片公司,它在学谷歌拿零食给TPU取名。
与英伟达用 GPU、AMD 用 Instinct/Solver 那种正经命名比,Jalapeño 这种“自带食物梗”的名字更接近 Google TPU 的Boardwalk、Bristlecone、Trillium。
但问题是,谷歌命名是植物/地理,OpenAI 这个直接是吃的。
当然,这也可能模仿自己“Open+AI”那种看似随意实则精心设计的品牌感。
目前,Jalapeño 芯片的工程样品已在实验室中以生产目标频率和功耗运行机器学习工作负载,包括 GPT-5.3-Codex-Spark。
但这不是重点。
重点是命名本身在告诉你:别把这颗芯片太当真。
九个月,他们说这是“史上最快”
OpenAI真的就很会PR。
在刚刚的新闻稿里,OpenAI直接表示:
“我们认为,这是高性能先进半导体领域迄今为止最快的ASIC(专用集成电路)开发周期。”
当然,每个发芯片的人都声称自己最快。
Google TPU 早期迭代周期通常 18 个月起步;亚马逊Amazon Trainium 第一代到第二代用了差不多两年;Apple M 系列从立项到流片 24-36 个月是常态。
更不用说Cerebras、Groq、SambaNova 这些同样做 AI ASIC芯片创业公司的第一代产品,14-20 个月是正常区间。
九个月是不是真的"史上最快"?
我们无法核实——行业没有公开标准数据。但如果是真的,只有一个解释:要么他们之前就有一个芯片设计团队在跑、所谓的“九个月”是从某个中间节点算起的,要么某些定义被悄悄放宽了。
但这依然超过了摩尔定律的18个月周期。
OpenAI甚至还指出,
这颗辣椒芯片,利用OpenAI模型加速设计与优化流程的部分环节。
"the use of OpenAI models to accelerate parts of the design and optimization process"。
这是真的meta:AI 帮 AI 做芯片。
但同样,这句话可以被解读成从布局布线优化到合成报告整理的任何一个环节,而最关键的物理设计、时序签核、DFT 步骤几乎肯定还是人做的。"AI 帮助做芯片"和"AI 设计的芯片"是两件完全不同的事,前者是真的,后者是偷换概念。
OpenAI强调,“早期测试显示,Jalapeño的每瓦性能将显著优于当前最先进水平。”
当然,当前最先进是什么?H200?B200?TPU v6 Trillium?AMD MI325X?还是某种出货量 1 万片的小批量产品?
OpenAI没有说。
推理专用芯片和通用加速器的区别,是这篇新闻稿反复强调的核心:
「这是为现代大语言模型推理设计的blank-slate design架构,而非从早期AI工作负载改造而来的通用加速器」。
这番表述明确对标英伟达:GPU是「通用」方案,而Jalapeño是专门为推理定制的芯片。
这套叙事逻辑站得住脚。推理的市场规模已经足够大,而且很多工作负载确实不需要GPU的通用性。
但有一个问题他们始终没提:训练怎么办?
新闻稿里完全没提训练,半个字都没有。
这意味着,OpenAI短期内的训练负载仍要依赖英伟达或其他厂商的硬件。Jalapeño解决的是「如何部署训练好的模型」这个问题,不解决「如何训练出模型」的问题。而后者才是更烧钱、也技术壁垒更高的核心环节。
因此这本质是一套减法策略:
不是直接替代英伟达,而是先夺走英伟达在推理领域的市场份额,把利润丰厚的训练市场留给对方。
这条路落地可行性更高,但天花板也更低,毕竟训练芯片才是利润最丰厚的部分。
Jalapeño 本身是不是真的"史上最快",是不是真的"远超当前最先进",要等到工程样片独立评测才能说。
目前无法预测。
但这则新闻真正在做的事情是——
OpenAI 把自己重新定位成“全栈AI公司”。
这一点新闻稿说得很直白:
"The point of this work is simple: inference is where AI reaches people."
表面是哲学,实际是商业策略。
OpenAI 在说"我们不只是 OpenAI,我们是和 Microsoft微软、Broadcom博通、Celestica 一起做底层基础设施的公司"。
“这就是全栈优势。OpenAI 不仅开发前沿模型或基于这些模型构建产品,还设计其底层基础设施:芯片架构、内核、内存系统、网络、调度、部署系统以及产品体验。由于 OpenAI 的业务遍及整个技术栈,因此每一层都可以围绕同一目标进行优化:使其模型运行速度更快、更可靠、更经济实惠。”
微软想要多少推理算力?OpenAI 现在说“我们能自己提供”。
这意味着,微软在 OpenAI 算力供给端的重要性会下降:训练用别人的,推理用自己的。
新闻稿后半部分的飞轮效应、更优的基础设施、更高的效率、更佳的模型、更好的产品、更多收入、再投资于基础设施。
这似乎是 Apple 在芯片上做的事情的翻版。
苹果花了 10 年、烧了几十亿美元,才让 M 系列在性能上摸到 Intel 的位置,再花 5 年甩开。
OpenAI 想用更短的时间做更激进的事情。
他们最大的优势:AI工作负载是他们自己的领域,他们比博通更了解内核架构,比英伟达更熟悉服务模式。
这条“以软件定义硬件”的路径,正是苹果用iPhone团队定义芯片、进而重塑MacBook发展路线的镜像。
但OpenAI自研芯片的最大风险在于,OpenAI在芯片产业链当中成很大问题。
OpenAI总裁兼联合创始人Greg Brockman表示:
“世界正在迈向计算驱动型经济。Jalapeño是我们长期全栈基础设施战略的一部分,旨在提升计算能力,从而打造速度更快、更可靠、更经济实惠的人工智能,让个人和企业都能从中受益,并用于解决更重要的问题。通过自主设计更多技术栈,我们可以更高效地提供更强大的智能服务,并不断推动先进人工智能走向更广泛的应用。”
博通公司总裁兼首席执行官陈福阳表示:
“我们与OpenAI的合作体现了我们对未来十年人工智能所需物理基础设施规模化发展的根本承诺。这仅仅是一个多代路线图的开端。通过与OpenAI直接合作开发我们业界领先的芯片,我们将与微软和其他合作伙伴携手,从2026年开始部署千兆瓦级数据中心。”
最后进行总结。
九个月,自称最快。性能功耗比,"远超"但没数据。
推理专用,训练继续依赖英伟达。
自研芯片背后真正的故事,是 OpenAI 在把自己变成一个垂直整合的算力公司——蚕食微软在算力供给上的地位,同时成为博通最大的客户之一。
下一个问题不是 OpenAI 能不能做出更好的芯片,而是:
当 OpenAI 开始自己设计推理硬件的时候,国内模型公司应不应该做一下?
以及,英伟达看到这则新闻之后,下一季度的财报电话会怎么讲推理业务的护城河?