介紹自從Intel向世界發布第一款采用下一代Conroe微架構的Core 2處理器至今已經2年了,基于它們的Pentium M架構改進而來,Conroe架構幫助Intel重新回到了處理器性能王座。芯片擁有寬闊的指令集,這使得處理器可以完整的執行所有需要的指令,并且配合更有效率的14級流水線設計,令其單位周期中的指令執行能力遠勝Pentium D。
如果你還記得在Core 2之前,曾經的Pentium D處理器,内部實際上是集成了2顆Pentium 4處理器,由于過高級數的流水線設計,導緻了單位周期内的效率低下,最終Pentium D采用31級流水線設計。Intel放棄了在單位周期中指令執行數的追求,轉而追求極緻的核心頻率,但是頻率的提升并不是最終的出路,Intel最終在Pentium D沖擊4GHz頻率時倒下。
新出路Core 2至今都還沒有在頻率上超越Pentium 4,不過由于它大幅提升了單位周期指令執行效率提高,該架構的性能取得了長足進步。不過Intel并沒有到這裏就止步,爲了進一步提升性能,Core 2也經曆了一段時期的強化,加入了更多執行單元,提高了SSE、SSE2、SSE3指令集,L2緩存容量不斷提升,L1和L2緩存的延遲進一步降低。
最終,Core 2幾乎比Intel此前的Pentium系列處理器性能強了2倍以上,同時它的性能也遠超AMD最快的Athlon X2和FX系列處理器,并且擁有更低的功耗,可超頻性也大幅領先。當年把一顆Core 2 Duo E6300或者E6400超上3GHz不是什麽難事兒。就在去年,Intel終于将Core 2全面轉向了Penryn架構。
從Conroe到PenrynPenryn不僅僅是采用了更先進的45nm制造工藝,此外在處理科學運算以及一些新的偏移指令時,Penryn相對于Conroe性能提高了一倍;128bit位寬和單通道偏移單元提高了Penryn的SSE2、SSE3以及SSE4指令執行性能,并且擁有偏轉執行功能。這裏要提到的是,Penryn也是Intel第一款支持SSE4指令集的處理器。
提升Penryn性能,Intel還爲它配備了更快的總線速度、更大的L2緩存容量。4核心Penryn擁有了高達12MB的L2緩存,每兩個核心共享6MB。由于這些方面的進化,Penryn與同頻的Conroe或稱爲4核心的Kentsfield相比,平均提高了10~15%的性能。當然支持了SSE4指令集,也對它的的性能提升很有幫助。
Intel與AMD的競争相對于競争方,AMD最快的4核心Phenom處理器——Phenom X4 9950,其性能僅僅能與Intel老一代的基于Kentsfield核心的4核心處理器Core 2 Quad Q6600、Q6700相提并論。現在,AMD正在積極準備即将到來的第一款45nm工藝産品;Intel也已經在前一代優秀架構上繼續加固,設計出了最新的下一代架構雛形——Nehalem。衆所周知,Intel早在8月就爲下次世代Nehalem架構取名爲Core i7。
就在過去的18月裏,Intel的處理器技術又有了質的飛躍,他們爲Core i7配備了最新的内存控制器;
Intel Quick Path Interconnect則是Intel用于對抗AMD Hypertransport的新一代總線技術;繼Pentium EE之後又一次加入了L3緩存,同時超線程技術也回歸;還有Nehalem Turbo Mode。不過我們現在隻看到了種種表面變化,Core i7的性能如何我們會通過今天的測試來說明。
Nehalem特性簡述和AMD K8架構之後一樣,Nehalem引入了
内存控制器,這有利于降低數據交換時的延遲,提高整體性能。Nehalem支持的内存規格爲DDR3-1333。集成内存控制器,這也注定了Nehalem能用的内存類型是固定的,目前所知肯定不會支持除DDR3外其它類型的内存。集成了的北橋也降低了CPU與北橋數據交換的延遲。
Intel全新引入的總線概念
QPI,Nehalem的QPI總線頻率高達6.4GHz,這比起目前最高的1.6GHz FSB要高得多,這可以大大提高CPU與其它任何高速設備之間的數據帶寬。類似于Pentium 4的超線程技術,單個核心可并行2條線程,這樣在進行線程密集任務時可以充分利用CPU資源。
與Pentium 4時代
超線程技術失落不同,Nehalem擁有更強勁的單核性能,這讓其在運行單線程時會空出部分資源,這時多線程就可以充分利用;多核心也是發揮多線程優勢的基礎,當某個核心滿載時,仍然有一些任務比較輕的、但數量比較多的線程請求時,就可以充分利用CPU資源;此外QPI總線巨大的帶寬也完善了多線程技術,在任務繁多時不容易出現數據停滞。
共享
L3 Cache:這顯然是吸取了Phenom的優點,并補償了Core2 Quad的不足。在沒有共享Cache的情況下,消息傳遞隻能通過固定機制,數據共享隻能通過讀寫内存,延遲變大、速度降低;加入共享L3 Cache可以讓4個核心交流無間。目前所知Nehalem L3 Cache高達8MB。
詳細對比啊圖表