繪圖雙雄大戰又再上演, NVIDIA 推出 GeForce 8 半代更新產品,核心代號為 G92 的 GeForce 8800GT 即將上市,定價 $199 至 $259 美元市場,正好填補效能級 Direct X10 產品的市場空缺。究竟 GeForce 8800GT 在制程、技術及效能表現如何 !?
<GeForce 8800GT 搶下頭香>
據台灣繪圖卡業者指出,原定於 2007 年 11 月 12 日發佈的 NVIDIA 新一代 G92 效能級階繪圖核心,在得悉對手 ATI RV670 繪圖核心亦會在 11 月 20 日登場後,決定將發佈日期提前至 10 月 29 日,希望能搶下頭香、先發制人,然而, NVIDIA 不單更改發佈日期,更針對 G92 繪圖核心的產品規格作出多番調整,其中預計 11 月 12 日發佈的 G92 產品為 GeForce 8700 家族,由於繪圖核心只有 96 個 Streaming Processor ,定價 $199 美元,在審慎評估對手 RV670 實力後,最終決定取消 GeForce 8700 計劃,改以 GeForce 8800GT 上場對戰 。
據了解, G92 是一顆原生 128 Streaming Processors 的繪圖核心, NVIDIA 先前規劃推出 GeForce 8700 是不希望與 GeForce 8800GTS 產品線出現重疊,進而讓廠商有足夠的時間去化庫存,但面對著 RV670 節節進逼, NVIDIA 策略轉彎,讓擁有 112 個 Streing Processor 的 GeForce 8800GT (G92-270) 替代上陣,另將 GeForce 8700 變身為 GeForce 8800GS ,並只針對 OEM 市場發售。
GeForce 8800GT (G92-270) ,分為 512MB 及 256MB 型號, 512MB 預計售價為 $249-259 美元,將取代 GeForce 8800GTS 320MB , 256MB 則會在數週後上市,定價 $199 美元,接替 GeForce 8600GTS 的原有地位。
此外, G92 亦 將推出 128 Streaming Processors 的 GeForce 8800GTS (G92-400) 型號,取代 GeForce 8800GTS 640MB ,預估售價為 $349 美元,暫定 11 月 19 日發佈。
<G92 ︰採用 65 奈米制程 內建 7.54 億個電晶體>
儘管繪圖晶片代號已提升至 G9x ,但由於繪圖架構未有更動,因此 , G92 僅僅只是 GeForce 8 家族的半代改版。
G92 採用 65 奈米制程,令成本及功耗均大幅下降,內建 7.54 億個電晶體,相比上代 G80 內建 6.81 億個電晶體還要增加一些,主要原因在於 G80 需要採用 NVIO-1 外置晶片處理影像輸入及輸出,而 G92 則完全內建於晶片內。除此之外, G92 擁有第二代 Pure Video 引擎、內建 HDMI 輸出功能、 PCI-Express 2.0 支援及新增更多 Texture Address Processor ,均是 G92 電晶體增長的原因。
G92 繪圖核心仍沿用 G80 架構,支援 Direct X10 及 Shader Model 4.0 ,採用 Unified Shader 設計,原生內建 8 組共 128 個 Streaming Processors (GT 版本被屏敝 1 組、共 112 個 ) ,每個 Processor 均可以處理 Vertex 、 Pixel 及 Geometry Shader 指令,減少因 3D 程序偏重單一 Shader 工作,導致工作量失衡閒置。
每個 Processor 均可同時執行 2 個 MAD 及 MAI ,且支援 IEEE 754 Floating Point Prcision ,可同時容許逾千個獨立的執行緒進行平衡運算,稱為「 GigaThread 」技術,適合作異類運算工作 (Heterogeneous Computering) ,例如 Physics 運算、影像編碼運算等,能大幅擴張繪圖卡的應用範疇。
G92 也進一步改良 Texture 運算單元, G80 每組可編程運算單元內建 8 個 Texture Filtering Unit 及 4 個 Texture Addressing Unit ,但 G92 則提升至每組內 建 8 個 Texture Filtering Unit 及 8 個 Texture Addressing Unit ,可令單一週期可處理更多獨立的 Texture 樣本,在部份情況下, Texture 處理效率進一步提升達 1 倍。不過, ROP 數目則由 G80 的 24 個,減至 G92 只有 20 個 (GT 版本則只有 16 個 ) ,因此在 HDR Rendering 及 Anti-aliasing 表現, G92 表現則略有不及。
記憶體頻寬方面, G92 只擁有 256Bit 記憶體控制器,相比擁有 384Bit 的 G80 大幅減少,兩者在原生記憶體效能上有明顯差距。不過, G92 主要是取代現有的 GeForce 8800GTS 家族, GTS 的記憶體控制器只提供 320Bit 寬度,與 G92 之間的差距相對減少,加上 G92 將配置較高時脈的記憶體顆粒,令兩者的實際記憶體效能十分接近,而且使用 256Bit 頻寬只需要 8 顆記憶體顆粒,可望進一步撙節成本。
值得注意的是, G92 是業界首款、亦是現時唯一支援 PCI-Express 2.0 的繪圖核心,每組 PCI-E Lanes 的速度由 2.5GT/s 提升至 5GT/s ,令單向頻寬提升至 8GBps ,大幅提高 3D 遊戲、專業繪圖及 GPGPU 等工作的運算效率,且其具有向下兼容的特性,能支援舊有的 PCI-Express 1.1 平台,不會出現新舊平台交接問題。
現時, Intel 已推出首款支援 PCI-Express 2.0 的 X38 晶片組, NVIDIA 與 AMD 則已規劃 11 月中旬推出支援 PCI-Express 2.0 的晶片組, 3 強力拱,正式開啟 PCI-Express 2.0 世代。
< G92 ︰支援第二代 PureVideo 引擎 100% Offload from CPU>
雖然 NVIDIA 已在 GeForce 8 家族中加入第二代 PureVideo 引擎,但只限於主流級以下的 G84 及 G86 繪圖核心,率先上市的高階 G80 繪圖核心僅支援第一代 PureVideo 引擎,因此,在播放 H.264 及 VC1 等高清影片時,仍需要將大部份的解碼工作交由 CPU 負責,儘管 NVIDIA 聲稱絕大部份使用 G80 繪圖卡的用家,均會配置高效能的 CPU ,在未有第二代 PureVideo 引擎情形下,亦能應付高清影片解碼工作,不過,用家始終對於 G80 未能支援第二代 PureVideo 引擎頗感失望,因此 NVIDIA 在效級 G92 繪圖核心中,追加了號稱 1 「 100% Offload from CPU 」的第二代 PureVideo 影像處理引擎。
據了解,傳統的 MPEG-2 、H.264 及 VC-1 軟體編碼, Bitstream Processing 、 Inverse Transform 、 Motion Compensation 及 Deblocking 完全交由 CPU ,但由於 CPU 並非專門設計作為解碼用途,因此在效能表現上差強人意。
為提升解碼效果, NVIDIA 於 GeForce 7 系列中加入 PureVideo HD 技術,將 Pixel Preduction 及 Deblocking 動作交由 GPU ,雖能減少對 CPU 的負擔,但 Bitstream Processing/Entropy Decode 及 Frequency Transform 仍需經由 CPU ,因此,處理器的效能仍會影響解碼效果,而 G80 繪圖核心雖然是 GeForce 8 家族產品,但仍屬於第一代 PureVideo 產品。
NVIDIA 終於在新一代 GeForce 8 家族的主流級及低階產品中,加入第二代 PureVideo 產品, Bitstream Processing 、 Inverse Transform 、 Motion Compensation 及 Deblocking 等工作均交由 GPU 負責,最高支援達 40Mbps ,並支援 " 畫中畫 " 影像解碼能力,由於此全新的影像處理器為可編程設計, NVIDIA 只需透過軟體更新,便可在日後支援未來的影像格式。
此外, H.264 使用的 CABAC(Context Adaptive Variable Length Coding) 或 CAVLC(Context Adaptive Binary Arithmetic Coding) 編碼,如果交由處理器進行解碼,其實效率非常低,低階處理器根本無法應付,而第二代 PureVideo 引擎加入 BSP 引擎 (BitStream Processor) ,能完全應付 H.264 的 CABAC 或 CAVLC 編碼,可達至 100% 的完全硬體解碼,即便是低階處理器用家,面對 H.264 CABAC/CAVLC 編碼亦能應付自如。
由於 HDCP 加密機制已被完全破解,因此業界傾向加入 ACS(Advance Access Contect System) 加密 / 解碼動作,進一步提高 HD-DVD 及 Blu-Ray 的版權保護能力,而第二代 PureVideo 引擎內建 AES128 運算引擎,可進行 ACS 硬體解碼工作,未來 Windows Vista 的影像串流方案 WVMF(Windows Vista Media Foundation) ,不論影像加密及解碼均需要執行 AES128 編碼運算,未來 AES128 加密及解碼應用將會更加頻繁,成為第二代 PureVideo 的關鍵優勢之一。
值得注意的是,第二代 PureVideo 引擎仍未完全將 VC-1 編碼交由 GPU 負責, Bitstream Processing 及 Entropy Decode 仍需交由 CPU 執行,雖然 VC-1 的 Bitstream 採用 Huffman ' s Coding 霍夫曼編碼,相較 H.264 採用 CABAC/CAVLC 編碼要求較低,市面上主流級處理器已能順暢應付,是第二代 PureVideo 唯一美中不足之處,看來要等待 G98 的第三代 PureVideo 引擎,才會把 VC-1 編碼「 100% Offload from CPU 」。
G92 ︰追加 HDMI 顯示功能 但仍未開放
G92 繪圖核心支援 2 組 Dual-Link DVI 輸出,最高可支援 2560 x 1600 (WQXGA) 解像度,繪圖核心同時內建 2 組 400MHz RAMDAC ,支援 2 組 2048 x 1536@85Hz (QXGA) 解像度的模擬輸出,所有 G92 繪圖卡均會內建 HDCP (High-Bandwidth Digital Content Prodction) CrytoRom ,以符合 HD-DVD 及 Blu-Ray 版權保護要求。
由於 G80 並未內建 HDMI 支援,造就對手 ATIR600 繪圖核心憑藉 HDMI 輸出方案,贏得不少 HTPC 用家的青睞,而甫登場的半代更新 G92 終於追加了 HDMI 輸出支援,不過仍採用 AudioByPass 設計,需透過外接線材將 S/P DIF 音效訊號傳送至繪圖卡進行 HDMI AudioMixing ,讓音效與影像組合成 HDMI 訊號,相較對手 ATI 內建 HD AudioCodec ,完全不需要外接線材,毋須霸佔主機板或音效卡上的數位音效輸出線路, NVIDIA G92 的 HDMI 支援方案顯得十分落後。
雖然 G92 規格明載支援 HDMI 輸出,但首批 GeForce 8800GT ,甚至是 11 月 19 日發表的 GeForce 8800GTS 均未提供 HDMI 支持,據台繪圖卡業者指出,這是因為產品在申請 HDMI 認証需耗費一段時間,為避免影響上市時程, 因而在 PCB 上行刪減 S/P DIF 接口,同時在 VGA BIOS 屏敝了 HDMI 功能,等待認証完成後,才會在下一批產品中開放 HDMI 功能。
另於 NVIDIA 給予廠商的 G92 規格書中指出, G92 將支援下代顯示輸出介面 Display Port ,但並非 G92 原生支援方案,而是 PCB 上預留加入 Display-Port Transmitter 的資料,預期在 Display-Port 尚未普及前, NVIDIA 仍不會量產具 Display-Port 輸出的產品。
<採用 G92- 270 繪圖晶片 NVIDIA GeForce 8800GT 正式登場>
圖為 NVIDIA GeForce 8800GT 512MB 繪圖卡,採用 NVIDIA P393 公板設計、 10 層 Layers PCB ,繪圖卡長度為 22.8cm ,需要外接一組 6 Pin PCI-Express 供電,產品最高功耗僅為 105W ,相比 GeForce 8800GTS 640 低約 45W 。
GeForce 8800GT 512MB 繪圖核心編號為「 G92-270-A2 」,採用 65 奈米制程由 TSMC 代工,擁有 112 個 Unified Streaming Processor , 56 個 Texture Filtering Unit 、 56 個 Texture Address Unit 及 16 個 Raster Operations Unit ,核心時脈為 600MHz , Stream Processor 部份則以 1.5GHz 運作,其運算效能高達 504Gigaflops ,相比 GeForce 8800GTS 的 345.6Gigaflops 更高,媲美 GeForce 8800GTX 的 518.4 Gigaflops 。
儘管 NVIDIA 已表明,將於下一代 nForce SLI 平台上加入 Triple SLI 支援,但 GeForce 8800GT 只建有 1 組 MIO 接口,相信 GeForce 8800GT 並不在 Triple SLI 支援之列。
顯示輸出方面, G92 已將輸出部份內建於繪圖核心內,因此並不需要使用 NVIO-1 顯示晶片,支援雙 Dual-Link DVI 及 7 Pins HDTV 輸出端子。 GeForce 8800GT 預留了日後支援 Display-Port 輸出的佈局,在 PCB 上預留加入 Display-Port Transmitter 晶片的走線。
支援 256Bit 記憶體介面 擁有 256MB 、 512MB 型號
GeForce 8800GT 512MB 採用 256Bit 記憶體介面,相較 GeForce 8800GTS 320/640 的 320Bit 為少,但由於 GeForce 8800GT 512MB 版本採用 Qimonda HYB18H512321BF -1.0ns GDDR3 記憶體顆粒,預設時脈為 1.8GHz DDR ,合共容量為 512MB ,記憶體頻寬可達 57.6GB/s ,與 GeForce 8800GTS 的 64GB/s 相差不遠,但由於只需要 8 顆記憶體顆粒便可組成 256Bit 配置,可望進一步降成本。
此外, GeForce 8800GT 尚有 256MB 版本,核心時脈、規格完全相同,且同樣採用 256Bit 記憶體介面,但記憶體顆粒將會改用 -1.4ns 速度,預設時脈 1.4GHz DDR ,記憶體頻寬將會下降至 44.8GB/s ,令兩者在效能表現擁有較明顯的差別。
據 NVIDIA 表示, GeForce 8800GT 512MB 定價為 249-259 美元之間, GeForce 8800GT 256MB 則為 199 美元,將會在數週後正式上市.