相关支持产品
GeForce 7800 系列
nForce4 SLI
GeForce 6800 Ultra/GT/std/LE PCI-E
GeForce 6600GT PCI-E
评选与评价
 
 



 
 
 































































































































































































视觉处理颠峰科技SLI——渲染地球

 
NVIDIA® SLI™技术被《大众科技》杂志评为2004年度最佳科技创新之一,《大众科技》杂志主编Mark Jannot表示,“这些获奖创新成果不仅影响着我们当今的生活方式,而且改变了我们思考未来的方式。”从GeForce 6系统产品问世以来,多项全新的图形处理技术加上高效率的超标量核心架构设计,承载了对终极视觉处理的重大使命。随着SLI多GPU并行渲染技术的发布,我们惊叹其诞生是应重大使命的召唤,是为了渲染整个地球……
 
人们需要多GPU并行渲染
 
在游戏和专业图形制作的一个普通场景中,系统需要源源不绝动态处理大量的3D物体,系统需要计算它们在下一帧中的表现状态。这些物体都是通过成千上万个三角形构成的,尽管物体后面的三角形会被前方的遮挡,但当表现到屏幕上时,它们还是要被进行计算。同时分辨率也是制约性能的重要因素,在1600x1200的分辨率下,需要描绘1,920,000个像素。纹理贴图、vertex和pixel shader程序这些工作都要在至少六十分之一秒内计算完毕,这样才能保证实时渲染地顺畅进行。这时系统性能的高低取决于一次能处理多少任务,而不是处理一个任务有多快。3D处理程序如何在现有技术和制造工艺的产品下实现看起来“不可能的任务”。这就必须依靠并行处理以使得性能成倍增长。
 
通过SLI的多GPU渲染技术,两块并联的GPU将获得超过单GPU 87%左右的性能提升。通过下图分析,可以清晰看出SLI的多GPU渲染技术对产业以及用户的重大存在价值。
 
 
我们都清楚一个现实:每一次艰难的技术创新所取得当时的最高成就,代表着当时整个产业技术和制造工艺所能达到的最高水平,产品性能和产品代价之间的函数增量越来越大,直至所付出的代价为无穷大。当单片价值219美元的6600GT组成SLI系统时,性能已经超过顶级的单块显卡,此时两片6600GT的市价比单片的6800Ultra还低,却获得近2.5倍成本的图形工作站代价的性能。同样,6800Ultra组成的SLI所获得性能增长是目前顶级产品所无法企及的,如果存在这样的产品,那么,它的代价是无穷大。这也说明了NVIDIA® SLI™技术已经达到了目前3D性能的最高记录,这还只是两片GPU互联,而NVIDIA® SLI™技术最高可以支持8片GPU并行渲染。Epic software(Unreal Tournament)的Mark Rein对NVIDIA SLI技术作出了评论,他说:"现在我们都在谈论Geforce 6800 PCIe SLI设置比过去一代的顶级显卡还快4倍,而那些显卡现在的售价仍然昂贵。在如此短的时间内这是闻所未闻的飞越!它是每个人的选择吗?不仅仅骨灰级的玩家需要此类的性能,对于象我们这样的开发人员这种性能也是可怕的,因为我们希望在下一代硬件问世之前看到我们下一代游戏的运行情况。其次它还扩展了你的显卡的寿命,假设今天你买一个$500的怪兽显卡,而未来该卡可能只需要$100,那么你不需要再花$500购买新的怪兽显卡,你只需要$100就可以获得双倍性能!"


NVIDIA® SLI™工作原理
 
NVIDIA SLI通过MIO数字化通信方式,并行构建多个GPU在PCI Express总线上。新的NVIDIA SLI技术已经“潜伏”在6600GT以上版本的系列产品中。在该类GPU内核中有部分的逻辑被叫做MIO,这些逻辑与引脚直接连接,然后可以再通过PCB上引出。通过MIO接口GPU之间能够快速直接地交换数据。与此同时在显卡PCB上方的MIO接口在组建SLI的时候只要安装一个桥接器即可。很短的布线长度、简单的连接方式和全数字化的内容传输使得NVIDIA SLI技术在实现过程中能始终保持稳定。
 
(NV40内核的部分逻辑电路被称做MIO)
 
并行处理技术中最为关键是NVIDIA的动态负载平衡技术。当年所有的板卡都因为并行模式下的负载平衡问题而出现无法突破的障碍和技术缺陷, NVIDIA SLI的动态负载平衡分配将会有多种模式,在默认情况下驱动程序会选择效率最高的一种方式自动完成后来的性能分配。数据通过PCI Express总线到达主GPU,那所有的GPU-to-GPU通信就通过NVIDIA的视频桥来处理了。视频桥是直接连接GPU的总线,被用于从一个GPU的帧缓存器直接向另一个传送数据。MIO能够以最高10GB/s传送数据,由于PCI Express总线延迟问题和带宽约束,这就是为什么选择MIO来直接沟通GPU之间通信的原因。
 

NVIDIA的动态负载平衡技术在维持着色渲染中的对称上,扮演了一个重要的角色,当然,动态负载平衡技术包含在NVIDIA支持SLI的驱动程序之内,可以随着最新的应用程序和游戏提供不断更新的硬件配置文件和渲染着色方式。随着驱动程序的更新以提供更新更好的支持,这也是为什么企业和用户选择NVIDIA产品的重要原因。动态负载平衡技术考虑工作量并作出两个关键决定:1)决定渲染着色方法,2)根据渲染着色方法,决定两个GPU之间的工作量分担。

 
(SLI动态负载平衡演示)
实际上NVIDIA的SLI系统有三种工作模式:首先第一种就是:兼容模式(compatible Mode),只有主显卡参与工作,整体系统图形性能是单显卡成绩。但副显卡可以多提供2个显示器连接,对于多屏幕游戏和工作具有实际意义;第二种:分屏渲染模式(Split Frame Rendering——SFR): 是把一个单帧的着色渲染工作分配到两个GPU当中。并又驱动程序智能地动态分配工作量,以达到步调协调并取得性能提升。第三种:交替渲染模式(Alternate Frame Rendering——AFR):一块显卡处理所有偶数帧,另一块显卡则处理所有奇数帧,编译的程序分为两部分,以共同合作同帧画面,同样取得性能提升。驱动程序平时并不确定使用AFR还是SFR,NVIDIA为100多个流行游戏中的大多数并为每一个创建了配置文件,决定在每个游戏中它们默认应该使用AFR还是SFR模式。只要帧之间没有依赖关系,NVIDIA的驱动程序就默认为AFR;例如在某些使用慢动作特效的游戏中,游戏本身并不清除帧缓存器,会紧接着前一个帧对下一个帧着色,把两个帧混合在一起来获得慢动作效果,在这种情况下有一个帧对帧的依赖,AFR就不能用了。如果AFR不能用,那么就用SFR,但现在驱动程序必须确定每个帧的多大部分被发送给GPU 1和GPU 2。因为驱动程序能够依靠两个速度严格相同的GPU,所以它可以对负荷的分配作出有根据的推测。这个有根据的推测是通过存储了每个GPU在已结束几个帧中的负荷历史表来得出的。基于存储在这个历史表中的结果,NVIDIA的驱动程序会作出一个预测,决定对后面帧的着色应该怎样在两个GPU之间分配,从而调整负荷系数。这就像CPU中的分支预报器。
 
搭建SLI系统简易向导
 
首先确保拥有一块支持SLI的主板,建议最好采用nForce4平台,这也是目前最优化的SLI平台。在安装硬件时,如果构建SLI工作模式时,就必须先将主板的SLI子卡双模式的一面金手指插入SLI PCI-E总线分配槽内。然后,连接两张卡顶部的视频桥通信子卡。启动系统进入CMOS内Advanced BIOS中的SLI mode项,选中“SLI”。然后安装新版的ForceWare。
 
 
打开显示设置窗口到“SLI多GPU”项,选上“启用SLI多GPU”。
 
 
在“性能和质量设置”项中,选择“SLI多GPU渲染”。然后,您就可以享受SLI所带来的视觉冲击了。
 

注意

所有 NVIDIA® 设计规范、参考板卡、文件、图纸、诊断信息、列表和其他文档(一并或分别称为“资料”)均“按现状”提供。NVIDIA® 公司不以明示、暗示、法定或其他方式对材料的非侵权性、适销性和适用于任何特定用途做出保证,并明确否认任何此类暗示保证。

我们认为所提供的信息是准确、可靠的。然而,对于由于使用该信息所造成的后果,或者由于其使用可能导致的对第三方专利权或其他权利的任何侵犯,NVIDIA® 公司不承担任何责任。不以暗示或其他方式授予NVIDIA® 公司的任何专利或专利权的任何使用许可。本出版物中述及的规范如有更改,恕不另行通知。本出版物取代并替换以前提供的所有信息。NVIDIA® 公司未将其产品授权用于生命支持装置或系统的重要组件,除非获得NVIDIA® 公司的明确书面认可。

商标

NVIDIA、NVIDIA徽标和NVIDIA GeForce均为NVIDIA® 公司在美国和其他国家的商标或注册商标。其他公司和产品名称均为其各自所属公司的商标。

版权

©NVIDIA公司,版权所有,2005年。
 




 

版权©1998-2006 骏兆电子有限公司 | 所有技术和产品解释权均归 NVIDIA® 公司所有 | 未经授权 请勿转载 最佳分辨率为 1024*768 版权声明