johnnydee
|
分享:
x2
|
[测试][显示卡] [XF]NVIDIA Leadtek GTX 260+ 超频又加料的260极限版SLI
话说NVIDIA的200系列中的260,原本可以舒糊的当它显卡二哥位置,谁知道对手来这一招HD 4800系列,很强的效能跟很杀的价格顿时让280、260陷入危机之中,因此除了各位前阵子看到不停掉价的200系列,现在NVIDIA打算把260挑出体质不错的核心并且加入更多Stream Processor以及超上更高的时脉来个绝地大反攻,这就是我们现在看到的GTX 260+。
Stream Processor是啥?
SP大概像是这样的东西,NVIDIA称为:统一着色架构。
显卡超频我想各位很容易了解,那么追加的Stream Processor是啥?对效能有甚么样的帮助?这边稍微跟各位简单介绍一下,这个东西真的讲很细可能就又是一篇长篇大作啰。各位如果还有印象的话,以前所谓的"开八管","开十六管"等等是在说甚么?为何现在没人再开管了?这就是以前的显示卡对于画面以及上色等等特效的处理方式,是用所谓的渲染管线来处理,它是由Pixel Shader Unit与TMU组成,一次完整的显示运算是由这两个单元负责,那么能同时间使用愈多的管线去计算那些数值,对于显示卡的着色能力等等当然是更快更好。不过自从Stream Processor(以下简称SP)统一着色架构出现后,完全取代了刚刚所提到的这两个单元能做的事情,它可以运算Vertex Shader,也可以运算Pixel Shader,还可以依据开发者的需求自由调配,也不用一定得按照先算Pixel Shader再算TMU的顺序进行,功能更加的强大。SP并不算是真正的处理器,它跟CPU的核心并不一样,CPU是真正完整的核心,SP应该是核心内的一个运算单元而已,所以误认为GPU随便就96个SP要不就128个SP应该比CPU强多了,这是错误的观念。SP最适合运算的资料型态是属于大量平行的资料,这种资料形态就是所谓的影像档,包含图片、影片等等,这也是为何NVIDIA要开发能够在C语言上善用SP的CUDA显示卡专用语言,让程式开发者能懂C语言就能把属于平行资料的部分交由GPU来计算,大幅减轻CPU的负担。
Leadtek GTX 260 Extreme+
之前小弟有幸测试到GTX260 3Way SLI的效能,的确让人刮目相看。虽然还是有人认为不是4870X2的对手,但是各有各的优缺点,至少260的耗电以及热能比就相当不错。但是虽然比对手低,不过三张卡挤在一块,中间那张卡就倒楣了,承受来自前后两边的热流使得中间那张卡的温度飙高到将近80度,如果没有特别搭配风扇来散热,真的是会热当。不过这次拿到的GTX 260+ SLI,耗电以及热能比起260都有明显降低,真的是让人激赏,260+是真正成熟的产品了。接下来我们将先从单卡开始,一直到SLI为您做效能、游戏、转档、耗电的测试。
先来怀念一下旧款260的SPEC吧,也是现在大跳水价钱的260,其中SP只有192个,核心时脉只有576Mhz,记忆体时脉是999Mhz。
Extreme+的GPU核心时脉被调高到602Mhz,记忆体时脉也被拉到1107Mhz,至于SP则从192个被塞到216个,这应该是这块GTX260核心的极限了。
彩盒是丽台最近惯用的印刷,机器人扛大枪。
背面是介绍这次的新改变,比起以往只说明游戏下有多好多好的叙述有用多了。
配件也算齐全,有S转色差、DVI转D-SUB、NV专用HDCP接头,HDCP音效线、大4P转6P PCIE的转接头、以及送不完的绝冬城之夜2游戏一片。
显示卡本体跟之前的260没啥差别,只是机器人变红色的了,并且下方有EXTREME字样。
SLI分列式。
风扇的贴纸也有注明是EXTREME版本。
3 Way SLI金手指接头。
两组6P PCIE电源输入端以及HDMI音效输出端。
这次决定来个见龙卸甲,首先是背面螺丝清空,后方总共有十颗螺丝,另外还有前方DVI处的两颗。
里面是用暗卡榫固定,拆卸要小心。
固态的散热块已经都黏在背板上了。
这边也与GTX260并无二致,仍然是CM代工设计的散热器。
核心本体是G200-103-A2版本,这颗核心内把SP塞到爆炸。
Power输入端用料相当不错,这几颗PWM并不是便宜货色。
这颗NVIO晶片是从8800就有的东西,它是负责纯粹输出的晶片,可以确保讯号的色彩深度与抑制噪讯等等的功能,所以它远离了GPU本体,而被安排在DVI Port的后方。
整张卡看起来Layout与260几乎是一模一样。
上机测试的主机板还是那张790i,本想上在X58上的,但是我实在欠CPU啊。
测试平台
跟上次的平台相比,QX9650被借走了,只好用E8500来推,希望能顺利推动,不过很可惜的是萤幕还没升级,仍然是笨Q 22”,只好就推到1680x1050了。
单卡效能测试
这次决定不超频CPU以及记忆体,基本款3.16G,DDR3-1333 7-7-7-20 1T为准起跑,单纯看看显示卡的效能。驱动版本是官方最新通过WHQL认证的180.48,Vista 32bit版本。
这次省略3DMark03、3DMark05,毕竟SP是针对DX10下的产物,跑DX9的程式及游戏是用模拟的方式进行,分数只能说是跑爽的,这是3DMark06,1280x800宽萤幕设定,未开反锯齿下的表现,得分13992分。从CPU得分来判断,应该是不太够力,不过现在只有单卡还算可以,等等SLI不得不超频一下了。
OMG,我还以为我看错又测了一遍,HDR掉分掉太多了,所以2AA总分只有7449。
4AA不降反升一点点,来到7457分。
8AA更可怕,7451分,所以216个SP以及NVIDIA那个Lumenex引擎发挥了满惊人的效果。
解析度1680x1050下,未开启反锯齿得分12958。
开2AA同样掉的很夸张,来到5783分。
4AA就几乎是持平了5775分。
8AA还可以稍微进步两分来到5777分。
3DMark Vantage E模式测试成绩E36950,测试项目是全开,所以在PhysX的部分也获得不少分数。
3DMark Vantage P模式得分P10878分。
H模式得分H7331分。
这个是满新鲜的一个显示卡测试程式,如果你上ATI卡还可以测到DX10.1的特效哦,测试完还会给你评比的分数,一共会执行10个场景,以海中漂亮的无人小岛为测试主题。
测试中,总之是令人心旷神怡的一个程式,看腻了3DMark这倒是个不错的选择。
这里设定也是1280x800,noAA,平均FPS 47.2张,得分1189分,分数不知道是怎么计算的。
那么来以平均张数为准吧,这是2AA平均约44.2张。
4AA平均42.6张。
8AA平均39.4张。
1680x1050解析度下,noAA平均张数为34.6张。
2AA平均为32.4张,这测试程式还颇吃重显卡的,这边已经快掉到30张以下了。
4AA为31.3张。
8AA为28.2张。
在Sandra 2009商业版的测试下,有两个项目可以测,一是GPU核心速度,二是频宽,这是记忆体频宽的测试,选了几张内建资料库有的卡来当作对比,呵呵,第一名。
这是关于GPU内Pixel运算能力的测试,同样也是第一名。
Crysis的测试,不过诡异的是居然可以偷测到1920x1080,这真是太令我惊讶了,明明萤幕就只有1680x1050,而且又不是CRT,驱动内”不支援的解析度选项”我也没开启,但是就可以跑的感觉,就跑跑看吧。成绩将以图表呈现。
这是noAA到8AA的部分,解析度可以分为三种测试,开启这颗萤幕的极限跑到1920x1080去了,以2AA到8AA的表现来看,几乎是没甚么再掉张数。
这是8XQ到16XQ的特效,这次灌完通过WHQL认证,Crysis的特效也多出8XQ到16XQ可以选择,以各解析度的成绩来看,除了1680x1050的8XQ到16X之间有掉一张多以外,其他几乎是没掉张。
不过很遗憾的是,Warhead中,就无法选择到1680x1050以上的解析度了。
不过同样的是有8AA以上的特效可以开,除了1680x1050的16XQ掉张比较明显以外,其他几乎也是没有甚么感觉,而且都属于顺畅执行的张数。
Devil May Cry4的设定,不过同样无法设定超过1680x1050的解析度以上,我们其他设定以最高等级的Super High为主,RUN两组解析度的成绩做参考,并且抓取第四场景的数值为主。
一个解析度共有七种不同的反锯齿,不过比较奇怪的是1680x1050解析度的2AA居然猛飙到185.92张,小弟反覆测试两次皆如此,只能说260+发飙了,而且在C8X以后的张数也是很惊人,但是这两个解析度下的成绩,不管哪一个都被评价为S级。
FARCRY2同样无法超过1680x1050解析度,因此只好测试两种解析度为参考,品质同样是最高阶Very High。
接下来看看UBISOFT最新的Farcry2吧。只有三种反锯齿可以开,综合来说,2AA到4AA的部分表现还算不错,不过在1680x1050的8AA比较弱一些。
这次取得了最新的TMPgenc 4.0 4.6.2.1版本,支援CUDA转档功能,看过M01的总统先生第一手的介绍后,小弟也想试试看是否真有差异。示范档案是我这次参加多媒体展在威刚摊位拍的妹妹,影片长度约6分钟,这点比较不好测试,因为听说档案不够长CUDA的能力比较难以发挥。不过这个逻辑是这样看的,如果档案短的时间差乘上时间差的倍数,那么得出的结论应该所差无几,所以还是测试看看吧。首先是没有CUDA开启的状态,转档格式选择XDVD,而所有的滤镜效果我几乎都开了,没有CUDA的转档吃掉双核心100%的资源比,而且需耗时15分钟以上才能转档完毕。
开启CUDA转档功能后,可以看到它会秀出目前使用CPU与GPU的比例让你参考,这个数值不是绝对数字,是会变动的,而在截图的这个Moment,几乎都是给CUDA作转档运算了,而CPU占用资源比例也会一路降降降,完成时间也会愈来愈快。
SLI效能检验
进入NVIDIA看板后,这里可以提供PhysX以及SLI的设定开启选项,啊,萤幕型号曝光了。
启用确定。
靠,保安,这是SLI的分数吗?怎么可以这么软啊!是的,这是小弟看到这个成绩的第一个感想,CPU不超不行了,3DMark对于CPU计算是有一定要求的,推不动喂不饱只是因为成绩不好看啊。
来吧,CPU超频至4.27G,DDR3-1800,CL7-6-5-20 1T,这样才稍微有感觉SLI出来了吧。1280x800,无反锯齿设定下得分19852分。
1280x800,2AA模式下得分19631分,几乎是没啥衰退。
4AA下得分18894分,衰减也是微乎其微。
8AA得分17795分,也有全程开启GPU-Z的温度探测做参考,与实际上感受相差不远,当然现在室温比较低也有关系,不过这次的GTX 260+的确温度不高。
1680x1050解析度,noAA模式,得分18971分。
2AA得分,18186分。
4AA得分,17474
8AA得分,15147,跟刚刚CPU未超频前的1280x800解析度下的SLI差不多,但是解析度却天差地远了。
E模式得分E55018分,这是甚么分数啊。
P模式也有P20840分,上次3 Way了半天也才P26XXX分。
H模式也有H14076分,全程的动画几乎都相当顺畅。
SLI下执行Tropic DEMO1.1版,平均张数维持50.5张,1280x800的解析度下,无反锯齿设定。
2AA平均张数为47.5张。
4AA平均张数为44张,几乎没啥掉。
8AA也有39.5张,这测试程式真的满硬的。
1680x1050,noAA平均张数为34.9张。
2AA掉两张为32.6张。
4AA为31.4张。
8AA为28.3张,还是顺畅喔,不过实在不敢想像1920x1200是不是也如此就是了。
Sandra这个测试下就恐怖了,不论是Float Shader或者是Double Shader都领先内建的资料库成绩相当多。
在记忆体频宽与资料传送速率的测试上也是有很好的成绩。
SLI下的Crysis我们一样来测试看看是不是能偷偷开高解析度,结果答案是ok的。而且比起单卡还能开到1920x1200,这个颇令我百思不解。
来看看NOAA到8AA的部分,像是音符降阶一般的感觉,平均掉张约为2-5张。
16XQ的部分,在1920x1200的部分比较差,掉到了12.63张。
Crysis Warhead的测试,同样无法开高解析度了。
1280x800下几乎是没甚么掉张,甚至还跟NOAA差不多,在1680x1050,只有8XQ跟16XQ掉比较多。
SLI Devil May Cry4设定,基本上与单卡是一样的,并没有办法偷开高解析度来测试。
SLI下的Devil May Cry4的张数真是满夸张的爆强,几乎都两百张左右再跳。
SLI Farcry2的测试设定。
双卡在Farcry2下的表现除了8AA掉到47张以外,平均都有56-62张。
这就是TMPGEnc 4.0,CUDA的切换方法,在GPGPU的选单里面独立出来的CUDA 2.0选项,很简单就是把它Enabled就好。
完成后记得要先让它跑过一次测试,这样CUDA开启才会准确。
这是没有开启CUDA的转档情形,同样把CPU资源吃满满,整个转档到好的时间需要18分钟左右。
开启CUDA后,CPU占用掉到47%,CUDA转档只花10分钟就可以解决,还可以愈来愈快。
耗电篇
单卡平台待机花费158w。
3DMark06飞龙场景花费281w。
SLI待机花费196w。
SLI 3DMark06花费459w左右。
结论:
这次的GTX 260 Extreme+,来的快又急,而且出场就跟原来的GTX 260同样定价,的确造成了原本的GTX 260的价格大崩盘,也出现了这几天市场上旧款GTX 260价钱热卖,不过我个人觉得,改款后的GTX 260+不但是解除了封印,而且更合理的功耗,即使组成SLI也比以往更省电一些,热力没有GTX260那么猛,值得推荐给预算在这个区块的准SLI主人做个参考。
|