 |
为DX10而生!NV新中端8600/8500全评测(一) |
| |
不知不觉中,微软DirectX 9 API已经陪伴我们走到了第五个年头!在经历了多个版本的改进以及前后三代显卡的发展之后,电脑3D图形性能变得空前强大! |
| 从DirectX 1到DirectX 7,每代DirectX的寿命都只有一年甚至还不到,DirectX 8也没能挺过两年,然而DirectX 9在位时间居然长达四年之久,而且在DirectX 10发布之后的半年内,仍然迟迟不肯退位让贤。从9.0、9.0b到9.0c,四年的寿命见证了DX9的成熟,从DX8两个版本到DX9的三个版本,Pixel Shader和Vertex Shader的魅力被发挥得淋漓尽致! |
| DirectX 10,整个世界都在等待…… |
|
| 与其说DX9成熟,不如说是DX9的潜力已经燃烧殆尽——游戏画质难以继续提高,显卡性能受到架构限制得不到充分发挥,DX9开始阻碍游戏和硬件的继续发展。于是,从2005年开始两大巨头的研发重心已经转移到了DX10之上,至于2006年下半年的7950GX2和X1950XTX只不过是新瓶装旧酒,填补世代更替的真空期而已。 |
| 所以,微软下一代图形API DX10成为了万众瞩目的焦点,G80、R600、vista系统和下一代游戏大作的关注度空前高涨,任何有关于DX10的风吹草动都会惊动游戏玩家的高度重视!随着NVIDIA GeForce 8系列显卡的发布,DX10终于从幕后走向了前台…… |
| 首款DX10显卡G80横空出世,出货量创高端显卡新纪录! |
|
| 2006年11月9日,NVIDIA GeForce 8800GTX/GTS的发布提前宣告了DX10时代的来临。虽然时至今日都还没有任何一款DX10游戏发布,但这丝毫没有影响到游戏玩家对DX10显卡的热情,截至春节前夕G80已经累计出货已达40万片,对于一款顶级显卡来说,能达到如此高的销量的确是史无前例的! |
|
| 为了降低DX10的门槛,进一步促进G80的销售,NVIDIA于2007年2月13日推出了GeForce 8800GTS 320MB显卡,以2500元左右的价格投放市场,立刻获得了中高端用户的青睐,成为DX10标准的开路先锋,从此G80的用户与日俱增。 |
| 中端G84低端G86正式发布,NVIDIA全线DX10显卡部署完成! |
| 不过,G80的热销只是相对的,因为高端游戏玩家所占比例依然很小,据统计有75%的用户会选择千元价位的中端显卡。也就是说G80对于主流玩家来说依然是可望而不可即的,更多的用户是在期待中端DX10显卡,或者是在DX9和DX10之间犹豫不决。 |
|
| 2007年4月17日,NVIDIA终于正式发布了基于G80图形架构的中端G84核心及低端G86核心,至此NVIDIA GeForce 8系列DX10全线显卡构建完成,DX10的普及之路由此开始,改朝换代的时刻终于来临了! |
| 虽然绝大多数玩家都在期待主流DX10显卡的早日降临,但还是有很多用户对DX10显卡心存疑虑:在没有任何一款DX10游戏的情况下,推出全线DX10显卡有何意义? |
| 如果没有G80,DX10游戏还得延期半年! |
| 电脑软件的发展始终是滞后于硬件的,因为程序员需要在相关硬件平台基础上才能开发软件,举个简单的例子:先有64Bit CPU,才会有64Bit操作系统,接下来就会诞生更多的64Bit应用软件和游戏,而且最先发布的产品往往就会成为事实上的标准。 |
| 在GPU方面的是道理完全相同的:G80提前发布就可以给游戏开发者提供一整套完整、稳定的平台,供其反复调试、优化之用,确保能够最大限度的利用硬件资源,甚至根据硬件规格在最终画面和特效方面作出妥协。 |

CES2007大会上的[Crysis]演示都使用8800GTX SLI系统 |
| 根据近半年来的情况来看,NVIDIA几乎参与了所有DX10游戏大作的研发(即NVIDIA the way it's meant to be played计划),8800GTX SLI成为了游戏开发者的基准平台。由此我们不难想象,2007年即将发布的几款DX10游戏对GeForce 8系列的支持度一定相当出色,GeForce 8系列的崭新架构在未来必将大放异彩! |
| |
领先竞争对手长达半年!NVIDIA继续领跑DX10: |
| G80在去年11月9日就已发布,而其假想竞争对手R600的发布日期预计是5月14日,作为同一代DX10显卡时间差居然长达半年!那么半年意味着什么呢?意味着半年更新、一年换代的“黄氏定律”即将生效!R600的竞争对手已不再是8800GTX,NVIDIA早就准备好了8800Ultra来对付! |
NVIDIA_G80.DEV_0191.1 = "NVIDIA GeForce 8800 GTX"
NVIDIA_G80.DEV_0193.1 = "NVIDIA GeForce 8800 GTS"
NVIDIA_G80.DEV_0194.1 = "NVIDIA GeForce 8800 Ultra"
NVIDIA_G80.DEV_019E.1 = "NVIDIA Quadro FX 4600"
NVIDIA_G84.DEV_0400.1 = "NVIDIA GeForce 8600 GTS"
NVIDIA_G84.DEV_0402.1 = "NVIDIA GeForce 8600 GT"
NVIDIA_G86.DEV_0421.1 = "NVIDIA GeForce 8500 GT"
NVIDIA_G86.DEV_0422.1 = "NVIDIA GeForce 8400 GS"
NVIDIA_G86.DEV_0423.1 = "NVIDIA GeForce 8300 GS"
NVIDIA驱动泄密:GeForce 8系列全家福 |
| 高端G80整整半年时间都处在无竞争对手状态,而在中低端,NVIDIA将继续贯彻先发制人、先入为主的策略,赶在ATI RV630/RV610之前发布G84/G86系列,抢占出货量庞大的中端市场。 |
| 回顾近三年来NVIDIA新产品发展历程,几乎半年一次的新产品更替速度不仅让竞争对手疲于应付,每一次性能/功能的提升则更加巩固了NVIDIA在全球图形领域NO.1的王者地位。 |
| G84/G86发布时间恰到好处: |
| 实际上,早在年初,NVIDIA中低端的G84和G86就已准备就绪,网上泄露的产品图片和测试成绩屡禁不止,NVIDIA之所以拖到现在才发布,是出于多方面的考虑: |
| 从自家产品线方面考虑:G84/G86和上代G71/G73的定位有一定程度的重合,如果提前发布新品,老产品的销售必然大受影响。因此NVIDIA留出了足够多的时间来帮助厂商和经销商消化库存,所以近一段时间以来我们可以看到7950GT、7900GS、7600GS等产品纷纷跳水,通过大幅降价的策略吸引用户购买,为DX10新品让路; |
| 从竞争对手产品方面考虑:ATI发布RV570/RV560之后起到了立竿见影的效果,独立显卡出货量开始回升,因为两款新核心无论性能还是价格方面都比G71/G73更具优势,而GeForce 7系列受到核心架构方面的制约,性能方面想要继续提升难度很高。此时在中低端导入全新的GeForce 8架构,是NVIDIA更新产品线同时解决性能瓶颈的良策; |
| 从DX10游戏方面考虑:今年下半年,首批DX10游戏大概有6-10款会正式发布,因此必须在第二季度将DX10全线显卡部署完毕,届时在新游戏的推动下,将会有一大批玩家购入新显卡。因此无论NVIDIA还是ATI都不会继续拖延产品,否则市场将会拱手相送,这是谁都不愿意看到的。 |
| G80超强的3D性能让世人为之一振,不过最令人感兴趣的还是G80所采用的全新架构,以及NVIDIA所赋予的最新技术特性。G84/G86核心作为GeForce 8系列的中低端产品,完整的继承了G80的所有特性,下面就首先来温习一遍GeForce 8的技术规格: |
| 统一渲染架构: |
| 在G8X之前,所有GPU都是传统的像素/顶点分离式设计,比如G71就拥有24条像素管线和8个顶点管线。顶点相对来说少一些,这样的结构和比例是芯片厂商根据常见游戏的情况而决定的。 |
| 但在不同类型的游戏中,像素和顶点并非时刻都保持在高负荷状态。比如一些RTS游戏或者RPG游戏的3D模型很复杂,需要耗费很大的顶点资源;而很多FPS和赛车类游戏则会将后期的像素特效作为重头戏,这样的好处就是可以给游戏带来更炫的视觉效果。 |
|
|
| 由此就导致了传统GPU在不同类型游戏中都无法有效利用硬件资源,不能充分发挥出晶体管规模的应有实力。为此,NVIDIA在GeForce 8这一代采用了“统一渲染架构”,庞大规模的流处理器能够胜任像素、顶点以及几何等多方面的着色运算。G8X核心能够通过专用的超线程调度模块,根据游戏的负载来指配流处理器按照不同比例处理像素和纹理运算,最大化GPU的资源利用,从而获得最佳效能! |
| 完美支持DirectX 10以及Shader Mode 4.0: |
| 绝大多数朋友都知道DX10以及SM4.0是最先进的3D图形技术,但是他们具体能够为硬件和游戏带来什么好处,相信了解的人并不是很多,毕竟目前还没有什么DX10游戏能够让大家大饱眼福。不过NVIDIA已经提供了大量的DX10实例,下面就通过这些真正的DX10图像来做个简单的技术介绍: |
| 1. DX10加入了一种新的Shader——Geometry Shader(几何着色): |
| Pixel Shader和Vertex Shader我们并不陌生,在过去的7年内,它们各司其职分别处理像素和顶点着色。而Geometry Shader则是DX10中新加入专门用来处理场景中的几何图形。Geometry Shader可以根据顶点的信息来批量处理几何图形。它可以将点、线、三角形等基本的构图元素连接起来,创造出新的多边形,并快速的将这些处理结果传递给其他Shader或显存,并且整个过程无需CPU参与。 |
|
| 几何着色的核心任务就是连点成线,它非常适合用来处理细小、但是数量又极其庞大的毛发、小草等物体渲染(NVIDIA DX10 SDK实例) |
|
| 以上两个实例都是源于NVIDIA DX10 SDK中提供的模型,属于真正的DX10图像,由于模型本身不算太复杂,8600运行起来也是比较流畅。 |
| 当年NVIDIA之所以将GeForce 256称为首款GPU,就是因为它能够硬件处理复杂的T&L(Transform & Lighting,坐标转换和光源),从此解放了CPU的负载,消除了3D渲染的瓶颈。如今DX10中所包含的Geometry Shader也是同样的道理,DX10 GPU相比CPU在处理Geometry Shader时的效率更高,DX10游戏编程也将变得更加灵活,场景也能更加复杂,应用前景十分广阔! |
| 除了新加入的Geometry Shader之外,SM4.0在SM3.0的基础上作了大量改进,下表就是SM4.0相对于早期1.1/2.0/3.0的指令和特性差异: |
|
| 2. 百倍于DX9的可用资源: |
| 对于Shader中可用的资源,在Shader Model 4.0中比原来有了惊人的扩充。就像早期的程序员们绞尽脑汁的省着用可怜的640k内存一样,在使用以前的DirectX开发游戏的过程中,程序员需要小心翼翼的分配珍贵的Shader寄存器资源。寄存器的数量,直接影响着Shader程序的复杂度。这和在640k内存的机器上,怎么也不可能写出Microsoft Office这样的大规模软件是同一个道理。而在DirectX 10中,将临时寄存器由原来的32个扩充到了4096个,将常量寄存器由原来的256个扩充到了65536个!而这些并不仅仅是DirectX给出的理论值——在GeForce 8系列的架构中,它们都是实实在在的在GPU上面! |
| 3. 更多的纹理: |
| 在Shader Model 4.0中提供了对纹理阵列(Texture arrays)的支持,在每个纹理阵列中,最多可以保存512张同样大小的纹理。而且每张贴图的分辨率被扩展到了8192×8192。更大的分辨率意味着纹理中更丰富的细节。在一个Shader中能够同时访问的纹理个数被增加到了128个,也就是说在每次执行同一个shader时,可以使用一个纹理阵列的512个纹理中的128个。所以说,在DirectX 10中,纹理的多样性和细节程度将会有大幅的提升。 |

NVIDIA首款、也是业界首款DX10 Demo,使用纹理阵列实现细致的纹理 |
| 4. 更多的渲染目标: |
| 所谓渲染目标,就是指GPU可以把画面绘制到的目标,我们可以把它理解为GPU的画布。一般来说,渲染目标被输出到屏幕上,这样我们就能看到画好的画面了;但是有时为了实现一些特效,某些渲染结果并不直接画到屏幕上,而是再返给GPU做进一步的特效处理;而且渲染目标中也不一定是画好的画面的颜色信息。 |
|
| DX9游戏不敢在同屏内设置太多景物,因为这样会导致GPU资源消耗殆尽,而在DX10模式下,有了几何着色和顶点着色的相互配合,一切都会变得相当简单(NVIDIA DX10 SDK实例) |
| 根据特效的需要,它们可能是每个物体距离屏幕的远近,或者物体表面上每个像素的方向,或者每个物体表面的温度(为了实现《分裂细胞》中那种热能感应器的效果)……总之为了实现特效,可以按需要在其中绘制任何信息。为了提高这种情况下的效率,很多新的显卡都支持在同一遍Shader执行结束后,同时把不同的信息绘制到不同的渲染目标中。在DirectX 9中就已经支持这种机制了,但是它约束最多同时向四个渲染目标绘制。而DirectX 10将这个数量提升了一倍! |
| GeForce 8系列除了采用统一渲染架构、完美支持DX10 SM4.0之外,NVIDIA还为其赋予了更多技术特性,NVIDIA将其新一代的图形引擎命名为Lumenex Engine。 |
| ● GeForce 8的心脏——流明引擎五大特性简析: |
| NVIDIA在GeForce 8这一代由于GPU架构发生了天翻地覆的变化,因此NVIDIA放弃了传统的CineFX命名,将其架构称为Lumenex Engine(流明引擎),现在就来看看全新架构有什么激动人心的特性: |
| 1. Coverage Sampling Anti-Aliasing (CSAA),多种全新抗锯齿模式:8xAA、16xAA和16xQ AA,单颗GPU就能实现高达16倍抗锯齿 |
| CSAA,直译就是覆盖采样抗锯齿,它同时包含了Coverage采样和Geomery采样,通过将多种采样模式复合,就能够提供四种全新的抗锯齿模式:8x、8xQ、16x和16xQ,其中8xQ和16xQ能够提供最完美的画质! |
| 得益于G80核心强大的实力,在不少游戏中即便开启16xAA,其FPS也不会比4xAA低太多。G84/G86的核心规格和显存明显不如G80,不过在AA方面的支持度丝毫没有缩水,16xAA损失较大,不过8xAA还是比较实用的。 |

noAA、4xAA和16xAA效果对比 |

很多主流游戏能够直接支持8xMSAA |

驱动中提供了8x、8xQ、16x和16xQ四种新AA模式 |
| 至于其他三种抗锯齿模式,可以方便的在NVIDIA驱动控制面板中调用。为了更好的提高CSAA对游戏的兼容性,新驱动提供了“置换任何应用程序设置”的选项,这种强制性的渲染模式支持范围更广! |
| 2. Lumenex Texture Filtering Engine,流明纹理过滤引擎,各项异性过滤图像质量大幅提高; |
| 3D游戏中常见的三维物体笼统的讲是分为两部分渲染出来的:建模和贴图。抗锯齿主要就是对模型边缘进行高倍采样,使得物体曲线看起来更加平滑;而纹理贴图在遇到倾斜的物体表面、弯曲的表面或者是远近景过渡时很容易出现模糊甚至失真的情况,各项异性过滤就是为了解决这种问题而诞生的技术。 |

三线性过滤和各项异性过滤效果对比 |
|
| 很多图形工作站在绘制地图或者复杂地形时,需要利用巨大数量的纹理贴图,而且对贴图质量要求非常高,这就要求显卡不但具备完美的各项异性过滤画质,而且性能损失必须将至最低。虽然G84/G86的硬件规格比G80差了很多,但在AF方面性能损失还是很小的。 |
| 3. 完美128Bit浮点精度高倍HDR+AA: |
| DX9C API当中FP16(16Bit浮点)HDR成为了事实上的标准,但由于会占用到原本属于MSAA的缓冲区,由此导致HDR和AA水火不容。在DX10 API当中引入了两种全新的32Bit HDR模式,这些新的格式使得纹理能够与原来占用同样多的显存空间,避免了大的缓冲区和带宽消耗,HDR和AA再无任何瓜葛。G8X完全支持每通道32位(4个通道加起来128位)精度的浮点数HDR。 |

GeForce 8默认就支持HDR+8xAA |
|

3DMark06完美的HDR+16xAA,你绝对找不到任何锯齿( 更多图片在此) |
| 由于DX10游戏没有到位,因此前面介绍过的很多先进技术规格目前还无法享用到,目前的最佳画面依然是Direct X 9.0C、Shader Mode 3.0。好在先进的GeForce 8架构在HDR+AA顶级特效方面支持非常完美! |
| 5. Quantum Effects,GPU物理加速技术: |
| GPU物理加速技术从去年开始进入我们的视野,Ageia首先推出专用的物理加速卡,但叫好不叫座。而GPU物理加速技术虽然尚未得到实际应用,但已被业界和用户普遍看好。 |
|
| NVIDIA将其物理加速技术称为Quantum Effects(量子物理技术),基于统一渲染架构的G80核心拥有多达128个流处理器,G84也拥有32个,远远超过了上代高端24管线的设计,而且每一个Stream Processor都拥有比DX9时代更加高效的浮点运算能力,要处理纯浮点运算的各种物理特效可以说是轻而易举! |
| G8X已经在硬件部分准备就绪,但如今物理加速引擎尚未统一,微软DX10 API也没有集成相应的标准,所以在软件方面G8X物理加速技术没有到位。根据之前的报道来看,NVIDIA很可能将会与Havok进行合作,依靠其新版Havok FX引擎在游戏中实现纯GPU物理加速,彻底解放苦累不堪的CPU。 |
|
|

烟雾喷向雕像时产生的气流干涉现象(NVIDIA DX10 SDK实例) |
| 目前还没有游戏能够支持GPU物理加速,但NVIDIA已经提供了多个基于GPU物理加速Demo,相信未来的物理加速引擎以及相关游戏会正式加入特效。想想看完美支持DX10的GeForce 8系列现在还只能跑DX9游戏,因此GPU物理加速遥遥无期也可以理解的。 |
| 高端G80不计成本只追求性能,是NVIDIA实力的象征;而中低端的G84/G86则要在成本、功耗方面做出妥协,在技术规格方面保持一致的情况下,大幅删减晶体管,因此G84/G86的硬件配置与G80差据较大,下面就来看看其架构部分。 |
| ● G84/G86核心架构图: |
| 根据NVIDIA官方说明,中端G84低端G86核心架构于G80是完全相同的,区别主要在流处理器部分: |
|
| 从上图可以看出,G80(8800GTX)庞大的流处理器部分主要有8个阵列,每个阵列包含16个流处理器(Stream Processor),总共就是128个。NVIDIA屏蔽了两个阵列和一组64Bit显存控制器,就诞生了96个流处理器的8800GTS显卡。 |
| 而中端的G84核心拥有两个阵列,和两个64Bit显存控制器,所以其核心规格就是32个流处理器、16个纹理单元、8个光栅单元以及128Bit显存。 |
| 低端G86核心只有一个阵列,规格为16个流处理器、8个纹理单元、8个光栅单元以及128Bit显存。 |

G8X的流处理器部分:每组阵列包含16个流处理器和8个纹理单元 |
| 由此我们可以看出,G84/G86的硬件规格的确和G80相差很多,性能方面的差距也会比较大。但是G84比起上一代的G71,规格上还是各有千秋的。 |
| ● 中低端显卡,成本控制是第一位: |
| 看了上面的架构图,很多人可能会比较纳闷:作为中端主力G84的流处理器居然只有G80的四分之一,显存位宽只有三分之一,G86的规格则更低,差距也太大了吧? |
| 但我们必须要清楚,G80核心是建立在6.81亿晶体管基础之上,而中低端显卡成本控制是非常重要的,于是只能做出妥协。为了严格控制晶体管,流处理器必然会大幅删减;为了让显卡制造成本更低,128Bit显存依然是最佳选择,这样显卡只需要配备四颗显存,PCB设计和用料也会宽裕很多。 |
|
G84的核心面积和G71差不多
|
| G84核心内建2.89亿晶体管,这已经超过了上代高端G71(2.78亿),但由于G84采用了80nm工艺制造,因此核心面积比90nm的G71稍小一些。 |
|
G86的核心面积比G73大不少
|
| G86核心内建2.1亿晶体管,当然会比1.77亿的G73核心大很多,因为两者都是80nm工艺制造的。 |
| ● NVIDIA中端产品规格对比: |
| 显卡型号 |
7950GT |
7900GS |
7600GT |
8600GTS |
8600GT |
8500GT |
| 核心代号 |
G71 |
G71 |
G73 |
G84 |
G84 |
G86 |
| 工艺制程 |
90nm |
90nm |
80nm |
80nm |
80nm |
80nm |
| 晶体管数 |
2.78亿 |
2.78亿 |
1.77亿 |
2.89亿 |
2.89亿 |
2.10亿 |
| 显存容量 |
512MB |
256MB |
256MB |
256MB |
256MB |
256MB |
| 显存规格 |
GDDR3 |
GDDR3 |
GDDR3 |
GDDR3 |
GDDR3 |
GDDR2/3 |
| 显存位宽 |
256Bit |
256Bit |
128Bit |
128Bit |
128Bit |
128Bit |
| 核心频率 |
550MHz |
450MHz |
560MHz |
675MHz |
540MHz |
450MHz |
| 流处理器 |
- |
- |
- |
1450MHz |
1180MHz |
900MHz |
| 显存频率 |
1400MHz |
1320MHz |
1400MHz |
2000MHz |
1400MHz |
800MHz |
| 像素单元 |
24 |
20 |
12 |
32SP |
32SP |
16SP |
| 顶点单元 |
8 |
7 |
5 |
32SP |
32SP |
16SP |
| 纹理单元 |
24 |
20 |
12 |
16 |
16 |
8 |
| 光栅单元 |
16 |
16 |
8 |
8 |
8 |
8 |
|
|
| 注:表中32SP/16SP就是G84/G86的流处理器数目,它能够处理像素和顶点着色,但在不同时刻只能处理其中一种;另外流处理器的工作频率和其它单元是分开设定的。 |
| 在8600GTS、8600GT和8500GT显卡发布之后,NVIDIA的中端产品线出现了一定程度的重合。通过规格对比可以看出,G71拥有256Bit显存带宽,以及更多的纹理单元,而G84的频率非常高,架构方面效率将会更高。可以说是各有千秋,至于最终的游戏性能,需要通过详细的评测方能知晓。 |
| G84/G86的确沿用了G80的硬件架构,虽然他们同属GeForce 8系列产品,但由于时间相差半年,因此NVIDIA在G80的架构基础上作了一些改进,使得G84/G86在执行效率以及功能方面超越了G80! |
| ● 采用80nm工艺,成本/功耗/发热更低: |
| 时至今日,很多人依然对G80采用了90nm工艺而耿耿于怀,庞大的晶体管再加上相对落后的90nm工艺,G80的功耗发热都非常大。如果G80采用了80nm工艺相信情况会好很多,而且频率更高性能更强——很多人都这样想。 |
| NVIDIA在工艺的采用方面一向都比较保守,这是因为新工艺的良品率不高,产能得不到保证。台积电80nm工艺在去年底才量产,如果用来生产恐怖的G80核心,那么产品发布可能会延期好几个月。采用了80nm工艺的R600就是典型的例子。 |
|
G84/G86都采用了台积电成熟的80nm工艺
|
| 如果条件允许的话,NVIDIA对待新工艺也是非常积极的,05年的90nm工艺NVIDIA率先用在了C51和G72上面,06年的80nm工艺,G73-B1核心也抢在了RV570之前推出。如今定位中低端的G84和G86理所当然会采用成熟的80nm工艺。 |
| 至于65nm工艺,将首先使用在入门级的G72核心上面,NVIDIA不会拿出货量庞大的主流产品做实验,否则遇到产品延期的现象就得不偿失了! |
| ● 第二代PureVideo HD技术,集成Video Processor 2: |
| 对于NVIDIA第一代PureVideo高清视频加速技术,相信很多人都记忆犹新,当时GeForce 6系列最高端的6800Ultra/GT并不能支持,这是因为NV40和NV45核心发布较早的原因,随后NVIDIA在定位稍低的NV42和NV43核心中追加了专用的Video Processor(视频处理模块),因此PCI-E版的6800和6600是首批支持PureVideo的显卡。 |
| 到了GeForce 7一代,GPU性能得到了大幅提升,但PureVideo视频处理模块只是沿用了GeForc 6的设计,并没有作任何改善,所以通过多方面的测试来看GF7的视频加速性能和GF6并无太大区别(前提是显存带宽足够),因为PureVideo并不会动用GPU核心Shader模块。随后的PureVideo HD也仅是追加了HDCP支持而以。 |

PureVideo分担了一半的解码任务 |
| PureVideo技术并不是纯硬件解码,它只是分担了一部分解码任务,具体就是负责后期输出的Motion CompensATIon(运动补偿)和Deblocking(解码去方块滤波),也就是说前期解码仍然要交给CPU完成。不过这已经能够将不堪重负的CPU获得解放,在GPU和CPU的配合下,流畅播放包括H.264在内的HDTV不成问题。 |
| 目前有三种HDTV编码格式:MPEG2(DVD编码)、WMV9(VC-1)和H.264。其中MPEG2由于压缩率很低,纯软件解码都不在话下;WMV9只要有支持PureVideo的低端显卡就能轻松胜任;只有H.264是个难题,由于码率很高的原因必须使用中高端双核CPU,配合中端PureVideo显卡(要求256MB GDDR3)才能保证不丢帧。也就是说光有PureVideo还是不足以对付高码率的H.264,还要求CPU比较强劲,显然这对于普通用户来说门槛比较高。 |
|
| 为此,NVIDIA在第一代PureVideo的基础上做出了改进,在G84/G86核心内集成了新一代Video Processor,而且还加入了全新的BitStream Processor Engine(二进制空间分割引擎),这个模块专门负责处理上代PureVideo所忽略的CAVLC(前后自适应可变长度编码)/CABAC(前后自适应二进制算术编码,压缩率更高)解码以及Inverse Transform(反变换),如此一来新一代PureVideo技术就可以独立完成H.264的解码输出全过程,将CPU占用降至20%以下! |

新一代的PureVideo技术支持纯硬件H.264解码 |
| 需要注意的是,新二代PureVideo HD技术仅针对H.264解码,至于MPEG2和WMV9的解码与上代并无区别,因为NVIDIA认为这两种编码上代产品可以轻松胜任,没必要在这方面花费精力。由于今后的发展趋势就是蓝光HD-DVD都采用H.264格式编码,因此这种“投机取巧”的做法还是值得肯定的。 |
| 另外,G80还是只能支持第一代PureVideo HD技术,原因同当年的6800Ultra比较类似,发布较早未能加入新技术支持。不过关系也不大,因为购买G80的用户肯定都会配备高端酷睿2双核CPU,因此H.264的解码也没有问题。 |
|
 |
以上内容转自泡泡网 http://www.pcpop.com/doc/0/188/188245.shtml |
|
|