相关支持产品
GeForce 6 系列CPU
评选与评价
 
 



 
 
 
































































































































Superscalar!!
超标量架构设计:强大的3D处理核心架构
 
2004年4月最后那一周,随着GeForce 6800家族的“震撼”登场,图形处理领域掀开了全新的篇章。8月3日,随着约翰.卡马卡的DOOM3“恐怖”登场,3D游戏进入了崭新癫狂的杀戮战场;8月13日,中国北京召开GeForce 6600发布会,随着从狂热发烧级的6800到超级性能主流级6600的先后发布,AGP GPU和原生PCI-E GPU全面登陆,nVIDIA基于新一代基本架构的产品逐步进入市场,标志着数字图形领域正逐步地、全面地进入了GeForce 6的时代。正如约翰.卡马卡所说的:“引擎就是法律”。对于图形处理器而言:核心架构就是“宪法”。任何功能以及性能、特效等决定性因素决定于处理器的核心架构,因此,先来了解代表当今全球数字图形技术颠峰的GeForce 6的核心架构部分,以了解该类处理器何以强大的理由和条件。
 
第一个超标量(Superscalar Design)图形处理器
 
有三种性能是直接决定图形处理器的基本等级——着色(像素)处理器的效率、几何(顶点)处理器的效率和显存接口的效率。对于现在的显卡来说,我们必须意识到——其实其最大的瓶颈就是着色引擎上。这种情形至少在UREAL 3.0游戏引擎出现之前不会发生较大改变,着色引擎的效率不足和新版Direct3D(包括最新的Shader Model3.0)所加入的越来越多特效形成了尖锐矛盾。GeForce 6800的超标量设计提供了很好的解决之道。

见下图NVIDIA的16条流水线像素处理器(GeForce 6600采用8条流水线)
 
GeForce 6800支持8x2以及16x1以及32x0三种流水线模式,即一个GPU周期同时处理两块像素,每块材质可以有8条流水线;或者同时只处理一块材质但是其中使用了全部16条流水线;当处理Z轴数据时它不需要分两次独立处理,也就成为事实上的32流水线,Z或者模板渲染的时候(比如Shadow Volume,这时候没有纹理)6800可以每个时钟周期处理32个像素。
 
 
上图展示了每个像素处理器内部的结构框图,可以看到它由一个z轴处理器和一个像素处理器组成。GeForce 6可以实现处理z轴数据时32x0即将像素处理单元也作为z轴处理器使用。GEFORCE 6的像素着色处理引擎可以说是一个完全崭新的设计。GEFORCE 6是16X1即每个时脉处理16个像素,含颜色及景深或者32x0 即每个时脉处理32个像素,只含景深的设计,即GEFORCE 6具备16条纯像素流水线。以Doom游戏为例,该游戏内含大量的模板阴影特效(stencil shadows),若要完整的呈现阴影的数量,就只有使用Z-stencil的部份。在这个情况下,GEFORCE 6可以在每个时脉计算32个像素, GEFORCE 6跟之前的显示卡不同的地方是,它的像素着色流水线设计已迈入32位浮点着色精确度时代。NVIDIA可完全呈现FP 32的Shader 精确度。
 
 
通过以上架构的介绍,可以了解到GeForce 6的像素处理器使用了超标量技术,这项技术使得GeForce 6在处理像素时,每个GPU周期可以处理最多达到8个像素点,要提高其效率,在处理器架构设计上要减少数据的等待时间,并且努力减少处理单元的空闲时间。用于提高处理器效率就主要有两种方法:一是流水线技术,将一个任务分解成为多个连续的子任务,在处理前一个子任务的同时就开始准备下一个子任务的数据并进行子处理器单元的初始化,当同时使用多条流水线时,就称之为超流水线技术或者并行流水线技术;另一个则就是超标量技术,它在处理器内部设置多个平行的处理部件,将多个相互无关的任务在这些处理部件中分别进行独立处理。也就是说:流水线是“分割成多个子任务并行处理”,而超标量是“无关任务同时并行处理”,在本质上是有区别的,流水线技术将处理器的等待数据时间尽量减小,最大限度提高处理器的效率,而超标量技术就是将数据的等待时间尽量减小,最大限度提高数据的利用效率
 
GeForce 6的超标量技术,就是在其内部,同时有两个着色引擎,可以在一个时钟周期内对两个象素分别进行独立的处理。虽然过去也有很多单周期多次着色的图形芯片,但它们都是使用一个着色处理器在一个时钟周期内执行两条指令,其限制很多,最大的一个限制就是它并没有更新原始数据的能力,所以其两条指令实质上必须对一个象素进行操作。所以GeForce 6800的着色引擎效率至少会是传统图形处理器两倍以上。
 
这就是GeForce 6800的性能会比上一代显卡提高那么大的原因。超标量设计解决了图形处理器目前最大的瓶颈,但目前除了大型主机处理器以外,仅GeForce 6将超标量技术带入核心架构当中。
 
视觉效果的新时代
 
GeForce 6系列超纯量架构内含原生的32位管线以及先进的影像功能,针对各种影像处理与效果带来更高的速度与精准度。许多处理功能首度能支持各种应用与效果,为PC平台带来逼真的剧院级效果。研发业者不须牺牲绘图速度来换取影像品质,可在所有复杂场景以及数字世界中创造出各种令人瞠目结舌的视觉效果。包括像NVIDIA HPDR这类革命性的创新技术,让包括着色、材质贴图、过滤、以及融合等每个层面的着色运算都维持浮点运算的精准度,带来更高的视觉品质以及更独特的功能。NVIDIA GeForce 6 系列GPU能突破许多最终障碍,达到有如真实世界般的剧院级写实度。在不久的将来,即使是专家也得再三确认 – 必须小心分辨眼前看到的究竟是计算机绘制的场景还是电影中的画面。
 

注意

所有 NVIDIA® 设计规范、参考板卡、文件、图纸、诊断信息、列表和其他文档(一并或分别称为“资料”)均“按现状”提供。NVIDIA® 公司不以明示、暗示、法定或其他方式对材料的非侵权性、适销性和适用于任何特定用途做出保证,并明确否认任何此类暗示保证。

我们认为所提供的信息是准确、可靠的。然而,对于由于使用该信息所造成的后果,或者由于其使用可能导致的对第三方专利权或其他权利的任何侵犯,NVIDIA® 公司不承担任何责任。不以暗示或其他方式授予NVIDIA® 公司的任何专利或专利权的任何使用许可。本出版物中述及的规范如有更改,恕不另行通知。本出版物取代并替换以前提供的所有信息。NVIDIA® 公司未将其产品授权用于生命支持装置或系统的重要组件,除非获得NVIDIA® 公司的明确书面认可。

商标

NVIDIA、NVIDIA徽标和NVIDIA GeForce均为NVIDIA® 公司在美国和其他国家的商标或注册商标。其他公司和产品名称均为其各自所属公司的商标。

版权

©NVIDIA公司,版权所有,2005年。
 




 

版权©1998-2006 骏兆电子有限公司 | 所有技术和产品解释权均归 NVIDIA® 公司所有 | 未经授权 请勿转载 最佳分辨率为 1024*768 版权声明