相关支持产品
GeForce 6200 TC
评选与评价
 
 



 
 
 










































































































































































































































































































NVIDIA TurboCache技术重新定义入门级PC的性价比
 
简介
NVIDIA® TurboCache™技术是一款已获得专利的硬件和软件一体化解决方案,可以直接利用系统内存进行渲染。正是基于这种创新架构,NVIDIA公司面向入门级台式机和笔记本电脑,推出了其屡获殊荣的NVIDIA GeForce™ 6系列图形芯片(GPU)架构,它支持微软® DirectX® 9.0 Shader Model 3.0和NVIDIA PureVideo™ 技术。
本技术简介将介绍TurboCache架构的工作原理,及其与非TurboCache GPU架构的差别。此外,本文还从图形性能和系统性能等方面,比较了TurboCache和现有的图形处理解决方案,以阐明TurboCache如何重新界定入门级PC和高能效笔记本电脑的性价比和功率要求。
 
TurboCache架构
 
TurboCache架构的主要特性包括:
 
专利型硬件和软件技术,可直接利用系统内存进行渲染

TurboCache管理器(TCM),可动态分配内存,从而最大限度地提高系统性能

智能软件算法,可最大限度提高应用性能

双向PCI Express®带宽,结合TurboCache架构,提高了图形芯片的性价比
 
三维图形管线主要分为四级:
 
1. 几何处理(转换和照明)

2. 设置(顶点处理,即将顶点转换为像素的过程)

3. 纹理应用(将纹理应用于像素)

4. 光栅处理(即应用照明和其他环境效果,以生成最终像素值)
 
图 1 显示了典型的三维管线的框图。
 
 

三角形设置

Z轴清除

着色指令分配


L2纹理


片段交叉通道


内存分区

内存分区
图1. 典型三维管线
 
图2显示了针对TurboCache技术重新设计的三维管线架构,以便GPU:
全效利用系统内存进行渲染

全效利用系统内存进行纹理处理

在任何地点动态分配表面(本地或系统内存)
 
新的内存管理单元(MMU)支持GPU在系统内存中顺畅自如地分配和取消分配表面,并高效读写内存。此外,通过更改多种管线要素,新的架构能够处理由于通过PCI Express接口接入系统而增加的时延。
 
 

三角形设置

Z轴清除

着色指令分配


L2纹理

MMU

片段交叉通道


内存分区

内存分区
系统内存
图 2. 针对TurboCache重新设计的三维管线架构
注意:图2中的黄色部分表示已经更改的部分。
 
除了在GPU中配置独特的硬件支持TurboCache外,还对NVIDIA ForceWare™图形驱动程序进行了修改,实现了以智能化方式确定色彩、纹理和Z轴缓冲数据的位置。这种处理能力最大限度地提高了每种应用的性能。
TurboCache管理器(TCM)可按应用的需要,将更多内存分配用于图形处理。当该应用关闭时,分配用于图形处理的内存将被释放,以供系统使用。这个过程是在后台完成的,并随应用的不同而不同。依靠这种方式,TurboCache技术通过智能化地分配本地图形内存与系统内存之间的负载,平衡了渲染过程中系统总带宽的占用。用于显示刷新的扫描输出缓冲内存则始终由本地图形内存提供。
 
TurboCache架构与 非TurboCache架构之比较
 
历来,诸如后台缓冲、深度缓冲、模板缓冲、环境贴图纹理或者其他数据等渲染目标保存在本地图形内存中。这就需要较大的本地帧缓冲内存,以便容纳可能的渲染目标。

由于具备直接利用系统内存进行渲染的独特能力,搭载了TurboCache技术的GPU就不再需要非TurboCache GPU所必需的较大本地图形内存。图3比较了入门级PC配置中的TurboCache架构和非TurboCache GPU架构。
 
 
内存

将112MB内存动态分配用于图形处理

内存

核心逻辑


核心逻辑

128MB有效图形内存

不能有效地直接利用系统内存进行渲染
4GB/s
4GB/s

4GB/s

4GB/s
128MB本地全缓冲
TCM
GeForce 6200 TC
2.8 GB/s
4M×32

非TurboCache架构 GPU

3.2 GB/s
16M×16
16M×16
 
图3. TurboCache架构与非TurboCache架构之比较(入门级PC配置)
 
请注意,TurboCache架构所需要的最低本地内存为一片频率为350 MHz 的4M × 32(或16 MB)内存。不过,TurboCache技术可以动态分配系统内存用于图形处理,这样GPU就可拥有整整128 MB的图形内存,就像拥有一颗传统GeForce GPU那样。

当图形应用和其他系统应用共享系统内存时,内存带宽就成为了实现高质量的用户体验的关键所在。借助PCI Express总线高达8 GB/s的双向带宽,TurboCache架构可提供10 GB/s以上的有效带宽(表1)。相比不能直接利用系统内存进行渲染的非TurboCache GPU而言,其带宽增加了50%。
 
表1. 内存带宽比较

PCI Express 带宽

本地内存类型和速度
本地内存带宽
有效带宽
基于TurboCache的GeForce GPU

8 GB/s

DDR,350 MHz
2.8 GB/s
10.8 GB/s
非TurboCache GPU

4 GB/s

DDR,200 MHz
3.2 GB/s
7.2 GB/s
 
TurboCache的性能
 
NVIDIA TurboCache技术使入门级PC的性能和特性提升到了新的层次。
图4和图5显示了Turbo Cache的性能优势,其测试系统配置如下:
 
平台:
英特尔奔腾4 3.4 GHz EE CPU
512 MB DDR系统内存
Windows XP SP1
驱动程序:ATI Catalyst 4.10,NVIDIA ForceWare 70.90
 
显卡:
英特尔集成式图形媒体加速器900(i915G)
ATI Radeon X300 SE (128 MB)
搭载了TurboCache技术的NVIDIA GeForce 6200(支持128 MB内存)
 
图4比较了搭载TurboCache 技术的128 MB GeForce 6200 GPU、英特尔i915G集成式图形卡和128 MB ATI X300 SE的性能。
 
 
图4. 图形性能:3DMark03基准测试,10 × 7,无AA或AF
 
搭载TurboCache技术的NVIDIA GeForce 6200的性能是英特尔i915G的两倍,比ATI Radeon X300 SE高出60%。此外,搭载TurboCache技术的NVIDIA GeForce 6200能够让入门级PC支持微软DirectX 9.0 Shader Model 3.0和NVIDIA PureVideo™特性。

在系统级性能方面,搭载TurboCache技术的NVIDIA GeForce 6200在各种系统基准测试中都比英特尔i915G和ATI Radeon X300SE胜出一筹。(图5)

请注意,集成式解决方案完全依赖于系统内存,所以在处理图形时所需要的系统内存总是比TurboCache解决方案多。正是由于其需要占用更高的系统内存,以及争用仲裁进程降低了系统性能。
 
 
图5. 系统性能:1280 × 1024 × 32与英特尔i915G和ATI Radeon X300SE之比较
 
结束语
 
凭借其直接利用系统内存进行渲染的独特能力,搭载TurboCache技术的GeForce 6200 GPU从根本上重新定义了入门级独立式GPU解决方案的性价比。由于其最大限度地降低了对本地图形内存的要求,搭载TurboCache技术的GeForce 6200实现了优于非TurboCache架构的128 MB图形处理解决方案的图形性能和系统性能。

对于笔记本电脑,搭载TurboCache技术的GeForce GPU还具备功耗更低的优势,因为这种GPU对独立式内存的要求更低,这意味着图形子系统的空间要求更小。这样,预装TurboCache GPU的笔记本电脑的体积更小,功耗更低。

如今,有了NVIDIA公司提供的创新TurboCache技术,用户能够在入门级台式机和外型小巧、能效更高的笔记本电脑上体验到GeForce 6系列图形芯片所具备的最新图形处理和视频处理特性,包括支持微软DirectX 9.0 Shader Model 3.0和NVIDIA PureVideo技术。
 
工作原理
革命性的TurboCache技术利用PCI Express图形总线的更高带宽,实现了大大优于传统视频内存解决方案的图形性能,因而带来了NVIDIA图形硬件始终一贯的出色性能和特性。通过允许图形芯片(GPU)分享专用视频内存的容量和带宽,并动态应用系统内存,TurboCache就像是一台涡轮增压器,提高了入门级PC的性能,并提供了更大的图形内存空间。
 
 
TurboCache架构的主要特性:

专利型硬件和软件技术,可直接利用系统内存进行渲染

TurboCache管理器(TCM),可动态分配内存,从而最大限度地提高系统性能

智能化软件算法,可最大限度提高应用性能

双向PCI Express®带宽,结合TurboCache架构,提高了图形芯片的性价比


凭借其直接利用系统内存进行渲染的独特能力,TurboCache技术从根本上重新定义了入门级独立式PC图形处理解决方案的性价比。有了NVIDIA提供的创新TurboCache技术,入门级PC和笔记本用户如今可以尽情体验GeForce 6系列GPU的最新图形和视频特性。

 
 
 

注意

所有 NVIDIA® 设计规范、参考板卡、文件、图纸、诊断信息、列表和其他文档(一并或分别称为“资料”)均“按现状”提供。NVIDIA® 公司不以明示、暗示、法定或其他方式对材料的非侵权性、适销性和适用于任何特定用途做出保证,并明确否认任何此类暗示保证。

我们认为所提供的信息是准确、可靠的。然而,对于由于使用该信息所造成的后果,或者由于其使用可能导致的对第三方专利权或其他权利的任何侵犯,NVIDIA® 公司不承担任何责任。不以暗示或其他方式授予NVIDIA® 公司的任何专利或专利权的任何使用许可。本出版物中述及的规范如有更改,恕不另行通知。本出版物取代并替换以前提供的所有信息。NVIDIA® 公司未将其产品授权用于生命支持装置或系统的重要组件,除非获得NVIDIA® 公司的明确书面认可。

商标

NVIDIA、NVIDIA徽标、TurboCacher和NVIDIA GeForce均为NVIDIA® 公司在美国和其他国家的商标或注册商标。其他公司和产品名称均为其各自所属公司的商标。

版权

©NVIDIA公司,版权所有,2005年。





 

版权©1998-2006 骏兆电子有限公司 | 所有技术和产品解释权均归 NVIDIA® 公司所有 | 未经授权 请勿转载 最佳分辨率为 1024*768 版权声明