NVIDIA TurboCache技术重新定义入门级PC的性价比 |
|
| |
简介 |
NVIDIA® TurboCache™技术是一款已获得专利的硬件和软件一体化解决方案,可以直接利用系统内存进行渲染。正是基于这种创新架构,NVIDIA公司面向入门级台式机和笔记本电脑,推出了其屡获殊荣的NVIDIA GeForce™ 6系列图形芯片(GPU)架构,它支持微软® DirectX® 9.0 Shader Model 3.0和NVIDIA PureVideo™ 技术。
本技术简介将介绍TurboCache架构的工作原理,及其与非TurboCache GPU架构的差别。此外,本文还从图形性能和系统性能等方面,比较了TurboCache和现有的图形处理解决方案,以阐明TurboCache如何重新界定入门级PC和高能效笔记本电脑的性价比和功率要求。 |
| |
TurboCache架构 |
| |
| TurboCache架构的主要特性包括: |
| |
专利型硬件和软件技术,可直接利用系统内存进行渲染
TurboCache管理器(TCM),可动态分配内存,从而最大限度地提高系统性能
智能软件算法,可最大限度提高应用性能
双向PCI Express®带宽,结合TurboCache架构,提高了图形芯片的性价比 |
| |
| 三维图形管线主要分为四级: |
| |
1. 几何处理(转换和照明)
2. 设置(顶点处理,即将顶点转换为像素的过程)
3. 纹理应用(将纹理应用于像素)
4. 光栅处理(即应用照明和其他环境效果,以生成最终像素值) |
| |
图 1 显示了典型的三维管线的框图。 |
| |
|
| |
|
三角形设置
|
Z轴清除 |
着色指令分配
|
|
L2纹理
|
|
片段交叉通道
|
|
内存分区
|
内存分区 |
|
图1. 典型三维管线 |
| |
| 图2显示了针对TurboCache技术重新设计的三维管线架构,以便GPU: |
全效利用系统内存进行渲染
全效利用系统内存进行纹理处理
在任何地点动态分配表面(本地或系统内存) |
| |
| 新的内存管理单元(MMU)支持GPU在系统内存中顺畅自如地分配和取消分配表面,并高效读写内存。此外,通过更改多种管线要素,新的架构能够处理由于通过PCI Express接口接入系统而增加的时延。 |
| |
|
| |
|
三角形设置
|
|
Z轴清除 |
着色指令分配
|
|
|
L2纹理
|
MMU |
|
片段交叉通道
|
|
|
内存分区
|
内存分区 |
系统内存 |
|
图 2. 针对TurboCache重新设计的三维管线架构 |
注意:图2中的黄色部分表示已经更改的部分。 |
| |
除了在GPU中配置独特的硬件支持TurboCache外,还对NVIDIA ForceWare™图形驱动程序进行了修改,实现了以智能化方式确定色彩、纹理和Z轴缓冲数据的位置。这种处理能力最大限度地提高了每种应用的性能。
TurboCache管理器(TCM)可按应用的需要,将更多内存分配用于图形处理。当该应用关闭时,分配用于图形处理的内存将被释放,以供系统使用。这个过程是在后台完成的,并随应用的不同而不同。依靠这种方式,TurboCache技术通过智能化地分配本地图形内存与系统内存之间的负载,平衡了渲染过程中系统总带宽的占用。用于显示刷新的扫描输出缓冲内存则始终由本地图形内存提供。 |
| |
TurboCache架构与 非TurboCache架构之比较 |
| |
历来,诸如后台缓冲、深度缓冲、模板缓冲、环境贴图纹理或者其他数据等渲染目标保存在本地图形内存中。这就需要较大的本地帧缓冲内存,以便容纳可能的渲染目标。
由于具备直接利用系统内存进行渲染的独特能力,搭载了TurboCache技术的GPU就不再需要非TurboCache GPU所必需的较大本地图形内存。图3比较了入门级PC配置中的TurboCache架构和非TurboCache GPU架构。 |
| |
|
| |
内存 |
将112MB内存动态分配用于图形处理
|
|
内存 |
|
|
核心逻辑
|
|
|
核心逻辑 |
|
|
|
|
128MB有效图形内存
|
|
不能有效地直接利用系统内存进行渲染 |
4GB/s |
4GB/s |
|
4GB/s
|
4GB/s |
128MB本地全缓冲 |
TCM
GeForce 6200 TC |
2.8 GB/s |
4M×32 |
非TurboCache架构 GPU
|
3.2 GB/s |
16M×16
16M×16 |
|
| |
图3. TurboCache架构与非TurboCache架构之比较(入门级PC配置) |
| |
请注意,TurboCache架构所需要的最低本地内存为一片频率为350 MHz 的4M × 32(或16 MB)内存。不过,TurboCache技术可以动态分配系统内存用于图形处理,这样GPU就可拥有整整128 MB的图形内存,就像拥有一颗传统GeForce GPU那样。
当图形应用和其他系统应用共享系统内存时,内存带宽就成为了实现高质量的用户体验的关键所在。借助PCI Express总线高达8 GB/s的双向带宽,TurboCache架构可提供10 GB/s以上的有效带宽(表1)。相比不能直接利用系统内存进行渲染的非TurboCache GPU而言,其带宽增加了50%。 |
| |
表1. 内存带宽比较 |
|
PCI Express 带宽
|
本地内存类型和速度 |
本地内存带宽 |
有效带宽 |
基于TurboCache的GeForce GPU |
8 GB/s
|
DDR,350 MHz |
2.8 GB/s |
10.8 GB/s |
非TurboCache GPU |
4 GB/s
|
DDR,200 MHz |
3.2 GB/s |
7.2 GB/s |
|
| |
TurboCache的性能 |
| |
NVIDIA TurboCache技术使入门级PC的性能和特性提升到了新的层次。
图4和图5显示了Turbo Cache的性能优势,其测试系统配置如下: |
| |
平台:
英特尔奔腾4 3.4 GHz EE CPU
512 MB DDR系统内存
Windows XP SP1
驱动程序:ATI Catalyst 4.10,NVIDIA ForceWare 70.90 |
| |
显卡:
英特尔集成式图形媒体加速器900(i915G)
ATI Radeon X300 SE (128 MB)
搭载了TurboCache技术的NVIDIA GeForce 6200(支持128 MB内存) |
| |
| 图4比较了搭载TurboCache 技术的128 MB GeForce 6200 GPU、英特尔i915G集成式图形卡和128 MB ATI X300 SE的性能。 |
| |
|
| |
图4. 图形性能:3DMark03基准测试,10 × 7,无AA或AF |
| |
搭载TurboCache技术的NVIDIA GeForce 6200的性能是英特尔i915G的两倍,比ATI Radeon X300 SE高出60%。此外,搭载TurboCache技术的NVIDIA GeForce 6200能够让入门级PC支持微软DirectX 9.0 Shader Model 3.0和NVIDIA PureVideo™特性。
在系统级性能方面,搭载TurboCache技术的NVIDIA GeForce 6200在各种系统基准测试中都比英特尔i915G和ATI Radeon X300SE胜出一筹。(图5)
请注意,集成式解决方案完全依赖于系统内存,所以在处理图形时所需要的系统内存总是比TurboCache解决方案多。正是由于其需要占用更高的系统内存,以及争用仲裁进程降低了系统性能。 |
| |
|
| |
图5. 系统性能:1280 × 1024 × 32与英特尔i915G和ATI Radeon X300SE之比较 |
| |
结束语 |
| |
凭借其直接利用系统内存进行渲染的独特能力,搭载TurboCache技术的GeForce 6200 GPU从根本上重新定义了入门级独立式GPU解决方案的性价比。由于其最大限度地降低了对本地图形内存的要求,搭载TurboCache技术的GeForce 6200实现了优于非TurboCache架构的128 MB图形处理解决方案的图形性能和系统性能。
对于笔记本电脑,搭载TurboCache技术的GeForce GPU还具备功耗更低的优势,因为这种GPU对独立式内存的要求更低,这意味着图形子系统的空间要求更小。这样,预装TurboCache GPU的笔记本电脑的体积更小,功耗更低。
如今,有了NVIDIA公司提供的创新TurboCache技术,用户能够在入门级台式机和外型小巧、能效更高的笔记本电脑上体验到GeForce 6系列图形芯片所具备的最新图形处理和视频处理特性,包括支持微软DirectX 9.0 Shader Model 3.0和NVIDIA PureVideo技术。 |
| |
工作原理
革命性的TurboCache技术利用PCI Express图形总线的更高带宽,实现了大大优于传统视频内存解决方案的图形性能,因而带来了NVIDIA图形硬件始终一贯的出色性能和特性。通过允许图形芯片(GPU)分享专用视频内存的容量和带宽,并动态应用系统内存,TurboCache就像是一台涡轮增压器,提高了入门级PC的性能,并提供了更大的图形内存空间。 |
| |
|
| |
| TurboCache架构的主要特性:
专利型硬件和软件技术,可直接利用系统内存进行渲染
TurboCache管理器(TCM),可动态分配内存,从而最大限度地提高系统性能
智能化软件算法,可最大限度提高应用性能
双向PCI Express®带宽,结合TurboCache架构,提高了图形芯片的性价比
凭借其直接利用系统内存进行渲染的独特能力,TurboCache技术从根本上重新定义了入门级独立式PC图形处理解决方案的性价比。有了NVIDIA提供的创新TurboCache技术,入门级PC和笔记本用户如今可以尽情体验GeForce 6系列GPU的最新图形和视频特性。
|
| |
|
| |
|
| |
注意
所有 NVIDIA® 设计规范、参考板卡、文件、图纸、诊断信息、列表和其他文档(一并或分别称为“资料”)均“按现状”提供。NVIDIA® 公司不以明示、暗示、法定或其他方式对材料的非侵权性、适销性和适用于任何特定用途做出保证,并明确否认任何此类暗示保证。
我们认为所提供的信息是准确、可靠的。然而,对于由于使用该信息所造成的后果,或者由于其使用可能导致的对第三方专利权或其他权利的任何侵犯,NVIDIA® 公司不承担任何责任。不以暗示或其他方式授予NVIDIA® 公司的任何专利或专利权的任何使用许可。本出版物中述及的规范如有更改,恕不另行通知。本出版物取代并替换以前提供的所有信息。NVIDIA® 公司未将其产品授权用于生命支持装置或系统的重要组件,除非获得NVIDIA® 公司的明确书面认可。
商标
NVIDIA、NVIDIA徽标、TurboCacher和NVIDIA GeForce均为NVIDIA® 公司在美国和其他国家的商标或注册商标。其他公司和产品名称均为其各自所属公司的商标。
版权
©NVIDIA公司,版权所有,2005年。 |
|
|
|