英伟达CEO黄仁勋用一句话定义了自己的公司:输入是电子,输出是Token,中间是英伟达。

4月15日,英伟达CEO黄仁勋接受播客主持人Dwarkesh Patel的深度访谈,内容涵盖英伟达的供应链护城河、TPU竞争威胁,以及英伟达为何不自己做云服务等问题。


英伟达:“电子Token”转换器

访谈开篇,主持人提出了一个尖锐问题:英伟达本质上只是写软件,芯片由台积电制造,内存由SK 海力士、美光、三星提供,封装由台湾ODM厂商完成——如果软件被商品化,英伟达会不会也被商品化?

黄仁勋给出了他对英伟达最精炼的定义:

最终,需要有某个东西把电子转化成Token。把电子转化成Token,并且让这些Token随时间变得更有价值,这件事很难被完全商品化。

他进一步说:“输入是电子,输出是Token,中间是英伟达。我们的工作是尽可能高效地完成这一转化。”

在供应链层面,外界关注的焦点是英伟达的采购承诺规模——最新财报显示接近1000亿美元,行业分析机构SemiAnalysis预测这一数字未来可能达到2500亿美元。黄仁勋解释了这背后的逻辑:

如果未来几年是万亿美元规模,我们的供应链能支撑它。

他说,这种能力并非单纯来自合同,而来自对上游CEO的持续“告知、激励和对齐”——让他们看清AI产业的规模和方向,然后愿意为英伟达的需求进行投资。CoWoS封装是典型案例:两年前是全行业最紧缺的瓶颈,英伟达“连续几个翻倍”地扩产之后,现在已基本不再是话题。

他判断,供应链上的任何瓶颈都不会持续超过两三年:“EUV机器、逻辑产能、封装——这些东西都不难复制,只需要需求信号。”他认为真正的长期制约在下游:能源政策。“你不能在没有电力的情况下建立一个工业,这才是需要时间的事情。”



TPU竞争:英伟达的计算栈是全球最佳性价比

云巨头(Hyperscalers)贡献了英伟达约60%的收入,但谷歌、亚马逊、甚至OpenAI等大客户都在加码自研TPU或其他ASIC芯片,这直接质疑英伟达的竞争地位。

黄仁勋的回应分两层。

第一层是定性区分:英伟达做的是“加速计算”,而不是专用张量处理单元。加速计算覆盖分子动力学、流体力学、数据处理、量子计算等几乎所有科学计算领域,远比AI更宽。

我们是唯一一家加速所有类型应用的公司。

第二层,黄仁勋称,球没有任何一个平台的性能和总拥有成本能优于英伟达,谷歌TPU、亚马逊Trainium都无法与之匹敌,我并不认可Trainium所宣称的40%成本优势。英伟达毛利率能达到70%,而ASIC芯片毛利率约为65%,企业替换产品并不能实现显著的成本节省。

英伟达的计算栈是全球最佳性价比,没有例外。没有一家公司能向我证明,今天世界上有任何平台的AI数据中心的总拥有成本(TCO)比我们更好。没有。Dylan的InferenceMAX摆在那里供所有人用,TPU不来,Trainium不来。

对于Anthropic大量使用TPU的问题,黄仁勋直接回应:

Anthropic是一个特例,不是趋势。没有Anthropic,TPU的增长从哪里来?是100%来自Anthropic。没有Anthropic,Trainium的增长从哪里来?也是100%来自Anthropic。

他也坦承,早年未能及时向Anthropic进行战略投资是自己的判断失误:

当时谷歌和亚马逊AWS投入了大量资金,Anthropic因此使用了他们的算力。我当时没有深刻意识到,风投根本不可能给一家AI实验室投50亿、100亿美元。这是我的失误。但我不会再犯同样的错误。

目前,黄仁勋已分别对OpenAI和Anthropic进行了大规模投资,据报道金额分别高达300亿和100亿美元。


为什么不自己做云?“尽可能少做”是哲学

手握巨额现金流,英伟达近期频频向CoreWeave等初创云服务商提供资金和算力支持。市场猜测,英伟达是否会越过客户,亲自下场做超大规模云服务商,收取算力租用费?

黄仁勋的回答涉及公司哲学:

我们应该做尽可能必要的事,做尽可能少的事。我们做的这些事,如果我们不做,我真的相信它们就不会发生。但云服务?如果我不做,有人会来做的。

他举了CoreWeave、Nscale、Nebius等“新云”作为例子——这些公司若没有英伟达的早期投资和支持,根本不会存在。但英伟达的介入是“让生态繁荣”,而不是转行做金融租赁或云计算运营。

他对于“不挑赢家”也有明确表态:“当我投资其中一家,我会投资所有家。”理由是:英伟达自己当年在60家3D图形公司中几乎是被公认“最不可能活下来”的一家,“我有足够的谦逊来认识到这一点”。


坚守卖铲人定位,GPU分配绝不搞“价高者得”

在供需极度失衡的背景下,英伟达如何分配紧俏的GPU?黄仁勋明确否认了“价高者得”的市场传闻。

我们绝不会那样做,这是糟糕的商业行为。你定好价格,然后人们决定是否购买。

黄仁勋解释了英伟达的分配逻辑:优先考察客户的排产预测和采购订单(PO),其次看客户数据中心的就绪程度,最终遵循先到先得的原则。“我更希望成为行业可靠的基石。如果你下达了1000亿美元的AI工厂订单,没问题,全世界只有我们能给你这种确定性承诺。”


不会放弃全球第二大市场

针对当前的芯片出口管制,黄仁勋从商业与技术标准的角度表达了务实的看法。

他指出,算力只是AI产业的底层输入,当受到约束时,竞争对手可以通过堆叠更多能源、使用更多上一代芯片,以及优化算法来弥补硬件代差。

他表示,首先要认识到:中国并不缺芯片。他们拥有全球顶尖的计算机科学家,众所周知,这些AI实验室里的AI研究人员有相当大比例是中国人。他们拥有全球约50%的AI研究人员。

他们是竞争对手,我们希望美国胜出,但我认为进行对话和研究交流可能是最安全的做法。放弃整个市场不会让美国长期在技术竞赛中在芯片层、计算堆栈中获胜。这是一个事实。


CUDA生态系统与飞轮效应

英伟达的核心竞争壁垒就是成熟的开发者生态,GPU全球装机量达到数亿级别,应用场景实现全面覆盖。

行业发展飞轮效应清晰,依靠最大的装机量、可编程的架构、丰富的生态体系以及全球海量的AI公司,形成强劲发展动力。再加上性价比、能效、客户基数均处于全球领先地位,进一步推动发展飞轮持续运转。


架构优势与产品路线图

黄仁勋表示,传统摩尔定律每年性能增长约25%,想要实现10到100倍的性能飞跃,必须依靠算法与计算架构的双重革新。Blackwell架构的能效相比Hopper架构提升50倍,这一成果绝非单纯依靠晶体管进步就能实现,架构优化与计算机科学创新才是核心关键。该架构支持全流程可编程以及全栈协同设计,依托NVLink、Spectrum-X技术实现,没有CUDA生态根本无法完成。

对于产品路线图与发布节奏。黄仁勋透露,英伟达产品会保持年度稳定迭代,从Vera Rubin到Vera Rubin Ultra,再到Feynman,每年都会推出稳定升级的新品。同时我们是全球唯一一家,能够承接从1000万美元到1000亿美元任意规模AI算力订单的企业。

⭐星标华尔街见闻,好内容不错过

本文不构成个人投资建议,不代表平台观点,市场有风险,投资需谨慎,请独立判断和决策。

觉得好看,请点“在看”