0图形芯片编年史Promo

多gpu:一个关于承诺和潜在失败的故事

2020年12月3日
图形芯片编年史Vol.5 No.1 -组合多个显卡以提高性能的概念在20多年前出现在3Dfx上。从那以后,英伟达和AMD一直在努力向消费者和游戏爱好者推销这一理念。

>>电子设计资源
..>>图书馆:文章系列
. . . .>>系列:图形芯片编年史
. . . . . .>>本系列简介
. . . . . .< <任天堂64

当3D图形控制器在20世纪90年代末出现时,3Dfx正在尝试提高性能和加速3D游戏玩法的方法。该公司开发的一项技术被称为扫描线交织(SLI),该技术于1998年作为其第二代图形处理器Voodoo2的一部分推出。

在SLI模式下,两个Voodoo2扩展板(aib)可以并行运行,每个aib可以绘制显示的另一条线。最初的Voodoo图形也有SLI功能,但该功能通常只用于街机和专业图形市场。

除了减少扫描时间,SLI还承诺增加可用帧缓冲区的内存。这将允许更大的模型加载,也将提高屏幕的最大分辨率。不幸的是,纹理内存保持不变,因为每个AIB都需要复制场景数据。再加上其他开销问题,理论上的性能提升被拖了后腿。随着3D模型和屏幕分辨率的不断增长,纹理地图的大小和数量也在不断增加,这进一步削弱了它所承诺的优势。


3Dfx试图通过添加另一个芯片来克服这个问题:纹理映射单元(TMU)。TMU允许在相同的图形引擎通过期间绘制第二个纹理,而不会影响性能。当它被引入时,Voodoo2是唯一能够单循环双纹理的3D AIB。使用Voodoo2的第二个TMU依赖于应用软件。当时两款非常受欢迎的游戏《雷神之锤2》和《虚幻》便成功地利用了双重纹理。事实上,在1998年,多重纹理几乎是标准。

在价格性能分析出现之前,它花了一些时间。1998年,一台8MB的Voodoo2 AIB的售价为249美元,现在大约为480美元。那时候一对voodoo - 2 aib大概要500美元。问题是,根据游戏和中央处理单元(CPU)的不同,平均性能提高只有60 - 70%。回报从未出现过,也不可能出现。然而,最终,这个概念并未完全消失。

当英伟达在2000年收购3Dfx的资产时,IP包中包含了SLI。由于缺少双AGP端口的主板,英伟达直到2004年才重新推出它。英伟达还是英伟达,他们把它重新命名为扫描线界面。英伟达还扩展了这一概念,使其能够合并最多4个aib,这是3dfx在专业领域通过其量子3d产品实现的。该公司还增加了几种操作模式:分帧渲染(每个AIB一半),交替帧渲染,甚至SLI抗锯齿以及使用集成GPU的能力,这种模式被称为混合SLI。

但是,扩张和重塑品牌并不能解决SLI的根本问题:该技术从未以200%的成本带来超过170%的改进。最重要的是,联合投资银行的价格年复一年地上涨。此外,英伟达必须提供的驱动支持,相当于对几乎每一款游戏的调整,在每一代新产品中都有所增加。


2005年末,为了应对英伟达的SLI品牌重组,刚刚收购ATI的AMD公司推出了自己的SLI技术,名为CrossFire。2013年,AMD将这一概念推向了一个新的高度,并取消了OTT表带。取而代之的是,该公司使用扩展直接内存访问(XDMA)来打开系统中多个gpu之间的直接通信通道,通过PCI Express (PCIe)接口连接。

AMD的XDMA通过在系统中的多个gpu之间打开一个直接通道来消除外部桥接。该通道与AMD的aib在同一个PCIe接口上运行。PCIe通常用于在gpu、主存和CPU之间传输图形数据。当AMD引入XDMA时,aib当时并没有使用PCIe所能提供的所有带宽,这比OTT带要多得多。外部OTT桥的带宽只有900 Mbps,而16车道的PCIe Gen 3可以提供最多32 Gbps的带宽。

AMD增加了带宽,并取消了OTT(后来英伟达还为此额外收费),这让它拥有了竞争优势。然而,AMD的aib在当时难以赶上英伟达的性能水平,这对其在市场上造成了伤害。具有讽刺意味的是,当AMD在2016年推出RX480时,该公司敦促用户购买两款AIB,并声称这两款AIB将以更低的成本超过英伟达的一款AIB。这是一个聪明的营销策略,但它并没有帮助AMD的销售。这也不是真的。


2017年,随着AMD和英伟达推出Dx12 aib, AMD放弃了对CrossFire的支持。该公司表示:“在DirectX 12中,我们引用多gpu,因为应用程序必须支持mGPU,而AMD必须为DX11创建配置文件。因此,我们不再在多gpu游戏中使用CrossFire标签。”

2019年,英伟达(Nvidia)紧随其后,并于2020年正式宣布了这一计划。对于专业的图形AIB产品线Quadro,英伟达引入了一种更高带宽的方案,称为多AIB的NVLink。NVLink指定点对点连接,数据速率分别为20 Gbps、25 Gbps和50 Gbps。

2020年底,该公司推出了一款高端消费级显卡RTX3090,并将NVLink作为其选择。350瓦的RTX 3090售价为1499美元。不太可能有很多玩家愿意花3000美元,外加90美元购买NVLink技术。他们可能还需要增加一个更大的电源(PSU)来管理所有额外的性能。然而,内容创建者可能想要为增加的性能买单。

>>电子设计资源
..>>图书馆:文章系列
. . . .>>系列:图形芯片编年史
. . . . . .>>本系列简介
. . . . . .< <任天堂64

从我们的合作伙伴

在与埃里克·博加廷博士讨论热带病研究方案之后

现在注册观看。时域反射计(TDR)显示一个互连的瞬时单端或差分阻抗剖面…

WavePulser 40iX高速互连分析仪

的参数。WavePulser 40iX高速互连分析仪从一次采集中计算单端和混合模式s参数。只是查…

欢迎来到边缘

照片/图像学分(按显示顺序)。pinkeyes - stock.adobe.com, Monopoly919 - stock.adobe.com, proindustrial2 - stock.adobe.com。加入我们吧…

智能电池充电和测试单元的好处

顶级提示:智能电池充电和测试单元|的好处赞助。由于电池护理理念和stra…

超高可靠性,低延迟

当你读这篇文章时,5G正在美国推广。有些人有一个兼容5G的手机,可以连接到AT&T网络,T-Mobile,等等。

声音你的意见!

本网站要求您注册或登录后发表评论。
目前还没有任何评论。想开始对话吗?

从我们的合作伙伴

在与埃里克·博加廷博士讨论热带病研究方案之后

现在注册观看。时域反射计(TDR)显示一个互连的瞬时单端或差分阻抗剖面…

WavePulser 40iX高速互连分析仪

的参数。WavePulser 40iX高速互连分析仪从一次采集中计算单端和混合模式s参数。只是查…

欢迎来到边缘

照片/图像学分(按显示顺序)。pinkeyes - stock.adobe.com, Monopoly919 - stock.adobe.com, proindustrial2 - stock.adobe.com。加入我们吧…

智能电池充电和测试单元的好处

顶级提示:智能电池充电和测试单元|的好处赞助。由于电池护理理念和stra…
Baidu