全文 —— 我们正在加速全球所有工具、数据处置惩罚引擎和数据库引擎,,,,,由于智能体使用这些工具,,,,,且它们的耐心比人类更低,,,,,要求快速响应。。。
因此我们推动所有工具基于 CUDA 运行在 GPU 上,,,,,速率更快。。。我们未来需要大宗 CPU,,,,,而Vera是专为智能体设计的 CPU。。。
已往的 CPU 设计拥有大宗焦点,,,,,便于租赁,,,,,云盘算的古板经济模式是按焦点收费。。。而未来人工智能的经济模式是按 Token 收费,,,,,即每美元能爆发几多 token。。。
我们未来需要做的是尽可能快速地天生和处置惩罚 Token,,,,,而Vera在这方面体现极为精彩。。。因此,,,,,我们期待NVLink72能够大获乐成,,,,,它需要极其强盛的清静性和保密盘算能力,,,,,这也是Vera Rubin成为全球首个端到端保密盘算平台的缘故原由。。。

我们已经准备好了,,,,,所有方面都已笼罩。。。伯恩斯坦研究剖析师Stacy Rasgon:列位好,,,,,谢谢接受提问。。。我想回到板块划分的问题。。。
首先,,,,,我想知道新兴云厂商属于哪个板块,,,,,是超大规模营业,,,,,照旧人工智能云营业??????我倾向于后者,,,,,但不太确定。。。另外,,,,,两者规模现在相当,,,,,你适才似乎体现人工智能云营业未来增添速率可能凌驾超大规模营业,,,,,这是你的看法吗??????
照旧你以为两者将坚持相似的增添速率??????黄仁勋:首先,,,,,你说得对,,,,,人工智能原生云厂商不自研、不自设计芯片,,,,,也无法将零星组件组装成人工智能工厂,,,,,它们对首个 Token 上线时间的要求极高,,,,,对架构兼容性的需求极高,,,,,需要运行所有模子、效劳全球客户,,,,,因此英伟达的架构对它们而言堪称完善。。。
我之前已经诠释过,,,,,LPX 的应用场景并不普遍,,,,,主要面向拥有大宗差别 Token 效劳组合的客户,,,,,针对高 Token 速率的高端效劳,,,,,客户数目未几,,,,,但 Token 速率极高。。。
这与我此前的表述完全一致,,,,,我仍维持这一判断。。。我预计 LPX 和其他基于流解码、专注高 Token 速率天生的加速器,,,,,在未来一段时间内仍将是小众产品。。。
凭证2022年的数据,,,,,全文的使用率增添了42%。。。