音乐最伟大的表演家一开始NVIDIA的黄延森在今年的主题演讲图形技术会议(GTC).在长达两个多小时的演讲中,他一直站在舞台的中心,让观众们在谈论英伟达最新的技术时保持着紧张的状态(图1)DGX-2。
1.在Jensen Huang的主题演讲中,一个主要亮点是NVIDIA新的光线追踪支持,它可以实时提供惊人的图像。
DGX-2采用了32 gb的特斯拉V100,将芯片内高带宽内存(HBM2)增加了一倍,并整合了NVIDIA的18端口NVLink NVSwitches(图2).特斯拉V100有6个NVLink连接,可以用来构建一个带有8个gpgpu的系统,而不需要开关。这是早期DGX-1使用的配置。
2.NVSwitch提供18端口的交叉连接,采用高速NVLink连接。
DGX-2有16个gpgpu通过12个NVSwitch芯片连接(图3).完全互联的系统拥有512gb的HBM2内存空间,所有GPGPU都可以访问,创建一个具有10240个CUDA核的巨型GPGPU。理论上,NVSwitch方法可以用来创建更大的系统。
3.DGX-2的爆炸视图突出了两个托盘,每一个都有8个特斯拉V100 gpgpu和6个NVSwitch芯片。系统只有一个512gb的HBM2内存空间。
该系统还配备了一对Intel Skylake-SP Xeon白金处理器,具有1.5 TB的DRAM,以及高达60tb的NVMe固态存储。DGX-2的价格为39.9万美元,功率为10千瓦。连通性包括8个InfiniBand EDR或100 gb以太网端口。它可以提供2千兆次浮点运算(PFLOPS)的性能。
这本身就是一个很棒的表演,但它还是不断地出现。
光线追踪的声明只是演示的第一部分。光线追踪往往是图形大师的圣杯。这是好莱坞用来制作逼真电影的方法;然而,根据分辨率和复杂性,单个帧需要花费几分钟到几个小时。实时3D游戏使用了各种捷径和技巧来达到这种效果,但差别非常明显,无法从高分辨率照片中分辨出光线追踪图像。
Quadro GV100支持NVIDIA RTX的实时光线跟踪功能(图4).它使用NVLink连接将四个gpu绑定在一起。实际上就是半个DGX-1。新板提供高达7.4 TFLOPS的双精度。使用NVLink连接添加另一块板,HMB2的支持将增加一倍,达到64gb。
4.NVIDIA Quadro GV100使用一对NVLinked V100 gpu提供实时光线跟踪支持。
在主题演讲中还有很多内容,包括关于NVIDIA的汽车模拟和自动驾驶汽车支持.我知道,我发现整个会议的兴奋是惊人的,因为在其他节目中,一些更冷静或不太相关的主题。
我确实想提到一个可能没有人注意到的小问题,但Jensen确实告诉“这些家伙们”,他们做得很好。我之所以提到这一点,是因为在主题演讲前的媒体演讲强调了多样性,以及出席会议的女性人数虽然总体上较低,但却在增加。明年,向“男男女女”致敬将是合适的。这只是一个提醒,我们的良好意图经常与我们传统的沟通方式相混淆。我一直这样做,并试图提醒自己。这也是电影的主题之一最伟大的表演家.
最后,干得好,延森,还有你在英伟达多样化的团队。