全文 —— 黄仁勋:LPX 专为低延迟和高 Token 速率设计,,,,但其吞吐量较低,,,,模子容量有限,,,,上下文处置惩罚能力较弱,,,,例如在软件编码、智能体事情负载等需要处置惩罚大宗上下文的场景中体现缺乏。。。。
因此其挑战很显着。。。。我之前已经诠释过,,,,LPX 的应用场景并不普遍,,,,主要面向拥有大宗差别 Token 效劳组合的客户,,,,针对高 Token 速率的高端效劳,,,,客户数目未几,,,,但 Token 速率极高。。。。
这与我此前的表述完全一致,,,,我仍维持这一判断。。。。我预计 LPX 和其他基于流解码、专注高 Token 速率天生的加速器,,,,在未来一段时间内仍将是小众产品。。。。
如你们所知,,,,Grace Blackwell和Vera Rubin支持人工智能的全生命周期,,,,从数据处置惩罚、训练准备、预训练、微调、强化学习一直到推理。。。。

在某些情形下,,,,只要效劳提供商已拥有高 Token 速率效劳,,,,我们就可以搭配 LPX,,,,让其效劳体现更精彩。。。。TD Cowen剖析师Joshua Buchalter:列位好,,,,谢谢接受提问,,,,恭喜你们取得精彩业绩。。。。
科莉特,,,,你在讲话中提到 GB300 是公司历史上最快的上量产品。。。。我们该怎样判断Vera Rubi和的上量节奏???它在芯片层面并非全新架构,,,,但机架设计相似。。。。
这是否意味着Vera Rubi的上量节奏与 GB300 相似,,,,照旧由于接纳新芯片而节奏更平缓???科莉特·克雷斯:我们此前已多次体现,,,,Vera Rubi将于今年下半年推出,,,,第三季度最先首批交付,,,,第四序度上量速率将一连加速。。。。
现在很难判断哪种产品上量更快,,,,但我们已经有明确的需求妄想和订单,,,,所有主流客户都已准备停当。。。。这些是极为重大的系统,,,,需要整合调试,,,,因此我以为要害在于产品上市的时间。。。。
现在判断还为时过早,,,,但可以确定的是,,,,第三季度最先交付,,,,第四序度一连上量,,,,明年第一季度也将迎来大规模交付。。。;;;;迫恃赫馐且桓龇欠驳募径龋,,需求呈抛物线式增添,,,,缘故原由很简朴:智能体 AI 已经到来。。。。
人工智能现在能够完成高效且有价值的事情,,,,Token 最先创立利润,,,,因此模子开发商竞相扩大产能。。。。在人工智能时代,,,,算力就是收入和利润,,,,英伟达是这个时代的焦点平台。。。。
英伟达Q1业绩会实录:Vera Rubin将全周期供货主要