一个B200顶五个H100 黄仁勋真正打破了摩尔定律

差评 2024-03-19 15:34+-

那个爱穿皮衣的黄姓男人又带着他的 “ 家伙事 ” 来炸场了。

昨天凌晨, NVIDIA GTC 大会正式拉开帷幕, NVIDIA 创始人兼 CEO 黄仁勋现场两个小时的演讲,让能容纳两万人的 SAP 体育中心直接被塞爆了。

有网友把黄仁勋比作是新的乔布斯,还问 NVIDIA 会不会成为新的苹果。

就连马斯克也称赞 “ 现在没什么硬件能比 NVIDIA 的更适合 AI 。 ” 

反正这次大会,老黄和 NVIDIA 是又被捧到了新高度。

那这次开发者大会,到底都讲了些啥?大会演讲全程两个小时,没有耐心看完演讲的友友们,直接看我的总结就行。

之前,有网友调侃过老黄是科技圈的泰勒 · 斯威夫特,所以这次一开场,老黄就先水了一波观众:注意注意,这不是演唱会,这是开发者大会。

接着又甩出一张图,跟大家伙儿唠了半小时计算机和 NVIDIA 的发展史,还 cue 到了当年把第一台 DGX-1 超级计算机送给 OpenAI 的事儿。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

不过这些,都只是些餐前小甜点,真正的大菜在后面呢。因为这次演讲的主题叫做《 见证 AI 的变革时刻 》,估计大伙儿也能猜出个七七八八,大会内容基本跟 AI 脱不了关系。

首先就是,全新的GPU 架构 Blackwell ,和新芯片 B200 。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

大会现场,黄仁勋先是掏出了一块 H100 ,还夸它 “changed the world” 。

但下一秒 Blackwell 架构的 B200 出现以后,大伙儿的注意力就被老黄口中这个 “  NVIDIA 史上最成功的产品 ” 给吸引住了。

肉眼上看, B200 和 H100 最大的区别就是,前者要更大。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

根据介绍, B200 由两个 Die( 裸片 )封装组合而成的,包含了 2080 亿个晶体管( H100 是 800 亿个 ),可以支持参数量多达 10 万亿的 AI 模型搞训练推理。

并且, B200 的算力性能是 20PFlops ,而上一代 H100 只有 4PFlops 。

实际,在芯片制程上 B200 其实是没什么创新的,毕竟 4nm 工艺已经是目前这颗星球上的芯片极限了,所以 B200 另辟蹊径,两个芯片之间的数据传输速度足够快。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

这样,两块芯片就来了一波超级合体,约等于是一块芯片,但威力却加倍了。

大会上老黄还装了个 X :他说当他们被告知 Blackwell 的野心超出了物理极限时, NVIDIA 的工程师回了一句: 那又怎样?

另外,芯片还能继续像搭积木一样合体,把两块 B200 组合到一起,再跟 NVIDIA 的 Grace CPU 配对之后,又能整出一个超级芯片 GB200 。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

这个 GB200 ,直接把计算性能拉满了。

按照老黄的说法,在 1750 亿组参数的 GPT-3 模型基准测试中, GB200 的性能是 H100 的 7 倍.

以前要 90 天内训练一个 1.8 万亿参数的 MoE 架构 GPT 模型,需要 8000 个 H100 ,但现在,有 2000 个 GB200 就够了。

老黄在这,也算是非官方的透露了一下 GPT-4 的参数量, 1.8 万亿参数的 MoE ,和之前网友猜测的其实也大差不差。

更夸张的是,还有把 36 个 GB200 放一起的 GB200 NVL72 服务器,还有结合了 8 个 GB200 NVL72 的 DGX SuperPOD ,这些由 Blackwell GPU 垒起来的计算平台,一个比一个炸裂。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

甚至于,老黄也直接说 “ DGX SuperPOD 就是 AI 的革命工厂! ” 

之前科技公司不是老嚷嚷着搞大模型算力不够不够,这次老黄直接就整了个算力怪兽出来。

我只想说,友商连 H100 还没赶上呢,这 B200 怎么又遥遥领先了?

而且,操心底层算力还不算完, NVIDIA 这次连 AI 应用的落地也要掺和一脚。就说这个 NVIDIA 要推出的 NIM 推理服务吧,它可以提供预训练好的 AI 模型并开放 API ,再让客户自己来开发应用。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

举个例子, NVIDIA 这次推了 25 个医疗场景的微服务,这些微服务包括了一系列模型,比如预测蛋白质结构的 ESMFold 、生成化学的 MolMIM 等等等等,医疗公司就可以基于这些微服务,开发相关的应用出来。

按照老黄的说法,现在的 NVIDIA 就是一个 AI 代工厂,里面有模型、有模型开发工具,还有一系列基础设施。

这就相当于扩展了自己的 AI 生态链条, NVIDIA 一下子路就走宽了。

另外,这次大会还有个重头戏,那就是人形机器人基础模型 GROOT 。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

简单来理解,用 GROOT 驱动的人形机器人可以理解自然语言、模仿人类的行为,从而实现跟物理世界的交互,也就是咱们经常提到的具身智能。

为了配合人形机器人, NVIDIA 还专门发布了个人形机器人芯片 Jetson Thor 。这又是 GROOT 又是 Thor ,难不成老黄是要致敬漫威?

总的来说,这次 NVIDIA 的开发者大会干货还是挺多的。

反正新架构出来之后, NVIDIA 车载计算平台 “ NVIDIA DRIVE Thor ” 要升级的消息一传开,比亚迪以后也要把 NVIDIA DRIVE Thor 芯片用在自家车上了,还要用 NVIDIA 的基础设施来开发自动驾驶大模型。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

NVIDIA 的 Omniverse 平台也跟苹果来了波联动,让设计师可以戴着 Vision Pro 来设计汽车;台积电和新思科也要引入 NVIDIA 的光刻计算平台 cuLitho ,给芯片制造提一波速。

还有什么 AI 游戏数字人技术,地球气候数字孪生, NVIDIA 这次掏出来的东西基本上就没有水货。

AI 军火商果然名不虚传,反正从我的观察来看,今年以来 NVIDIA 的股价已经涨了超过 80% ,财报也是一片欣欣向荣。

但即便如此,不少人还是觉得 NVIDIA 的帝国背后,危机重重,有人觉得 NVIDIA 的生意太依赖谷歌、微软这些巨头了,不太具有持续性。

一个B200顶五个H100 黄仁勋真正打破了摩尔定律

也有人把 NVIDIA 比作是我们这个时代的思科,因为在上个世纪末,一堆人觉得思科的交换机和路由器,就是互联网时代的黄金,只要互联网在,思科的股价永远涨,可最后,思科的股价在互联网泡沫的破裂中,蒸发大半。

但不论如何,如今的 NVIDIA 依旧是 AI 芯片领域的最强话事人。

正如 NVIDIA 官网上说的那样,是他们发明了 GPU ,也是他们让 GPU 从专用的图形处理设备,变成了通用计算平台,从而推动了如今 AI 的发展。

所以在我的眼里, NVIDIA 不单单只是 AI “ 战争 ” 中的军火商,因为如今 AI 这个火热的场子,一定程度上都是 NVIDIA 搭起来的。

在新一代的 “ 军火 ” 亮相之后,我已经来不及想看下一阶段的 AI 大战,有多激烈和壮观了。