ATI于2001年8月推出的Radeon 8500 AIB R200图形处理器采用了150纳米的制造工艺,代号为“卓别林”。AIB与DirectX 8.1兼容。和opengl1.3 api。
R200引入了一些新的和增强的功能,但最值得注意的是ATI的“TruForm”功能。TruForm是由ATI(现在的AMD)开发的半导体知识产权(IP)块,用于加速硬件镶嵌。下面的图是一个简单的例子,从一个粗糙的立方顶点集绘制一个球体。
镶嵌可以根据对象到视图的距离进行相对,以调整细节水平。这使得接近观察者(相机)的物体有很好的细节,而更远的物体可以有粗糙的网格,但同时在质量上似乎可以比较。它还减少了一个网格所需的带宽,允许它在shader单元内部被细化。
ATI的TruForm创造了一种由弯曲三角形而不是平坦三角形组成的新型表面,称为N-Patches或PN三角形。这种新方法允许表面完全在图形处理器中生成,而不需要对现有的由平面三角形组成的3D图像进行重大更改。根据ATI的说法,这将使开发人员更容易使用这项技术,并允许它避免破坏与旧图形处理器的兼容性,同时提供高质量的视觉效果。该技术得到了DirectX 8s N-patches的支持,它计算如何使用三角形来创建一个曲面。
ATI的R200 GPU在当时是一个平均大小的芯片:120毫米²的面积。它包含了6000万个晶体管,四个像素着色器和两个顶点着色器,八个纹理映射单元和四个rop。ATI当时表示,R200比英特尔的奔腾III处理器更复杂。
Radeon 8500运行在275 MHz,并补充了使用128位内存总线的64 MB DDR。这是一个单插槽的AIB,不需要额外的电源连接器,因为它只消耗23 W。AIB有一个AGP 4x接口,并提供三个显示输出:DVI, VGA和S-Video。
R200是ATI的第二代GPU,搭载Radeon品牌。和当时的大多数aib一样,8500还包括Windows的2D GUI加速,并提供内置MPEG编解码的视频加速。
R100有两个渲染管道,而R200有四个。ATI将更大的处理管道命名为Pixel Tapestry II。新的设计将AIB的填充率提高到10亿像素/s。
ATI在最初的Radeon芯片上使用每个流水线三个纹理单元,因此它可以在一个时钟周期内将三个纹理应用到一个像素上。然而,游戏开发者却选择不支持这一功能。而不是浪费晶体管在一个不支持的功能,ATI决定建立R200只有两个纹理单位每个管道。这与英伟达的GeForce3相匹配,让开发人员很高兴。
但是ATI很聪明,它使Pixel Tapestry II能够在一次传递中应用6个纹理。传奇游戏开发者John Carmack当时正在致力于即将到来的《毁灭战士3》,他说道:“《毁灭战士》中的标准光照模型,包含所有功能,但没有自定义着色器,需要在GF1/2或2 Radeon上进行5次传递。”他说,同样的照明模式将采取“两个或三个传递上的GF3,应该是可能在一个明确的+单一传递上的ATI的新部分。”
与原始的Radeon, ATI介绍其“魅力”硬件转换和照明引擎。R200的魅力引擎II是该公司的第二代硬件加速、固定功能转换和照明引擎,它受益于R200增加的时钟速度。
ATI在R200中检修了顶点着色器,并将其命名为“Smartshader”引擎。Smartshader是一个可编程的顶点着色器,与Nvidia的GeForce3顶点着色器相同,因为这两家公司都符合DirectX 8.1规范。
在2000年底,就在推出Radeon 8500/R200之前,ATI也推出了它的“HyperZ”技术,这基本上是一个z压缩方案。ATI夸口称HyperZ可以提供每秒15吉特赛尔的填充率,尽管R200的理论最大值只有12吉特赛尔。事实上,HyperZ在测试期间确实提供了性能改进。
ATI的HyperZ技术由三个特性组成,它们相互配合,以提供内存带宽的“增加”。
ATI的HyperZ采用了Imagination Technologies为其PowerVR贴图引擎开发的延迟渲染过程中的几个概念。
需要大量的内存带宽来重复访问z缓冲区,以确定哪些像素(如果有的话)在被渲染的像素前面。HyperZ进程的第一步是在一个像素被发送到渲染管道之前检查z缓冲区。这种方法在R200渲染之前删除了不需要的像素。
然后将Z-data通过无损压缩过程来压缩z缓冲区中的数据。这也减少了s数据所需的内存空间,并在访问z缓冲区时节省了数据传输带宽。
当使用Z-data时,一个快速Z-Clear过程在渲染图像后清空Z-buffer。ATI当时有一个特别有效的z缓冲区清理过程。
第一个Radeon使用了8×8块。为了减少所需的带宽,ATI调整块大小4×4。R200每个时钟可以丢弃64个像素,而不是8个。(GeForce3每个时钟可以丢弃16个像素。)
ATI还实现了一个改进的Z-Compression算法,根据数据表,给他们一个20%的提升Z-Compression性能。
Jim Blinn在1978年引入了凹凸贴图的概念。这种方法通过在物体表面上使用光照来创造人工深度。然而,大多数游戏开发者直到2000年初才开始使用凹凸贴图;《光晕1》是1998年第一批使用它的游戏之一。
把它们放在一起
在采用凹凸贴图、法线贴图和视差贴图来模拟更高的网格细节之前,3D形状需要大量的三角形。使用的三角形越多,你就可以创造出更逼真的表面。
为了减少使用三角形的数量,使用了镶嵌。TruForm使用现有的三角形对3D表面进行镶嵌,并添加额外的三角形,为多边形模型添加细节。结果是TruForm技术在不显著影响帧率的情况下改善了图像质量。
然而,TruForm很少被游戏开发者使用,因为它要求模型在DirectX 8.1之外工作。由于没有广泛的行业支持,大多数开发人员干脆忽略了它。最重要的是,2000年英伟达在AIB市场份额上超过了ATI,开发者不愿意投资于第二大供应商的独特功能。当现在属于AMD的ATI在2007年升级到Radeon X1000系列时,TruForm不再是一个硬件特性。
在Radeon 9500中,渲染到顶点的缓冲特性可以用于镶嵌应用。这也得益于微软支持Shader Model 3.0的硬件。镶嵌在专用硬件返回了ATI的Xenos GPU的Xbox和Radeon R600 GPU。
只有在Direct3D 11和opengl4中,对硬件镶嵌的支持才成为强制要求。在这些api中定义的细分,只支持AMD在2009年推出的更新的TeraScale 2 (VLIW5)产品和基于gcn的产品(从2012年1月开始提供)。在AMD的GCN(下一个图形核心)中,镶嵌操作是几何处理器的一部分。
当Radeon 8500问世时,ATI的软件团队正在经历一场艰难的管理改组,公司发布的驱动程序也存在问题。更糟糕的是,该公司在一些基准测试中作弊,报告的分数比评测人员能达到的分数要高。ATI也有其平滑视觉抗锯齿的问题。
TruForm,这个本该将ATI推向领导地位的功能,由于管理不善和营销不力而失去了。ATI在开发过程中建立的技术领先地位被浪费了。