StephenLai
★☆☆★
|
分享:
▼
x0
|
[教學][硬碟] 磁牒陣列(RAID)常見故障與技巧
RAID容錯式獨立磁碟陣列技術概述
RAID容錯式獨立磁碟陣列是冗余獨立/廉價磁牒陣列( Redundant Array of Independent/ Inexpensive Disks)的簡稱。它最早是由三個定居在加利福尼亞州 伯克利(Berkeley:美國加利福尼亞州西部城市)的工程師共同在1988年提出的。 RAID容錯式獨立磁碟陣列技術主要的目的就是提供更高的冗余量、更大的存儲容量和更強的效能--這都是相對於一個硬碟的操作系統而言的。現在的很多流行的主機板,比如 Abit KR7A-RAID容錯式獨立磁碟陣列現在就支持至少3種方式的的RAID容錯式獨立磁碟陣列( RAID容錯式獨立磁碟陣列 0、RADI 1和RAID容錯式獨立磁碟陣列 0+1),下面我們就簡單的介紹一下RAID容錯式獨立磁碟陣列中一些常用術語的意思:
陣列(array):指的是一組驅動器,數目可以是從2個到幾百個 磁牒(disk):在RAID容錯式獨立磁碟陣列中指的就是硬碟 磁牒組( disk set):採用一定RAID容錯式獨立磁碟陣列方式組合在一起的硬碟組 ECC: 錯誤校驗碼,在RAID容錯式獨立磁碟陣列技術中 XOR和 Hamming code是兩種最一般的ECC系統。 漢明碼( Hamming Code):一般用於RAID容錯式獨立磁碟陣列 2中,是一種較老的ECC系統,現在基本上被XOR校驗系統所取代了 SCSI:就是小型電腦系統接頭(Small Computer System Interface)的意思。 striping:這個詞比較難以翻譯,它指的就是把資料分成若干個資料塊然後依次存儲在多個硬碟中的程序。 XOR: Exclusive OR的簡稱,一般用於Raid 3、Raid 4和Raid 5中,利用這種技術可以修復磁牒中的資料 其實在一般套用中所使用的或者在一些資料中所提到的RAID容錯式獨立磁碟陣列模式一般有這麼幾種: RAID容錯式獨立磁碟陣列 0、 RAID容錯式獨立磁碟陣列 0+1、 RAID容錯式獨立磁碟陣列 1、 RAID容錯式獨立磁碟陣列 2、 RAID容錯式獨立磁碟陣列 3、 RAID容錯式獨立磁碟陣列 4、 RAID容錯式獨立磁碟陣列 5和 RAID容錯式獨立磁碟陣列 6。在這些套用中 RAID容錯式獨立磁碟陣列 2、 RAID容錯式獨立磁碟陣列 3和 RAID容錯式獨立磁碟陣列 4相對而言用的到機會會更小一些,所以我們只是簡單的進行一下介紹;RAID容錯式獨立磁碟陣列 0從嚴格意義上來說還不能算是真正的RAID容錯式獨立磁碟陣列模式;另外我們還會對於 RAID容錯式獨立磁碟陣列 6進行一下簡單的介紹。
RAID容錯式獨立磁碟陣列 0
在 RAID容錯式獨立磁碟陣列 0模式中,資料被分割為一定數量的資料塊(chunk)交叉寫在多個硬碟上,一般的來說在RAID容錯式獨立磁碟陣列 0系統中資料被分割的數量同RAID容錯式獨立磁碟陣列陣列所使用的硬碟的數量是有關的,比如RAID容錯式獨立磁碟陣列 0中採用了3塊硬碟,那麼資料將會被分為三分依次的寫入三個硬碟--通俗的說這種模式其實就是利用RAID容錯式獨立磁碟陣列技術讓系統認為三塊硬碟組成一個容量更大的硬碟,因為這個程序中沒有資料校驗所以這種RAID容錯式獨立磁碟陣列模式是讀寫速度最快的一種。但是由於它的這種結構也就使得這種RAID容錯式獨立磁碟陣列模式並沒有冗余性,如果一塊硬碟出現了故障,其它硬碟上的資料也都不能使用了,所以嚴格意義上來說它不是「冗余獨立磁牒陣列」的範疇。RAID容錯式獨立磁碟陣列 0模式一般用於需要快速處理資料但是對於資料的安全性要求不高的場合。
這種RAID容錯式獨立磁碟陣列模式的特點是簡單,而且並不需要複雜和昂貴的控制器。組成中RAID容錯式獨立磁碟陣列 0模式至少需要2塊硬碟,最終得到的存儲容量也是這兩塊硬碟的和。
隨機讀取效能:很好 隨機寫入效能:很好 持續讀取效能:很好 持續寫入效能:很好
優點:最快的讀寫效能,如果每塊硬碟擁有獨立的控制器效能將會更好 缺點:任何一塊硬碟故障所有的資料都會丟失,大部分的控制器都是通過軟體實現的,所以效能並不好
RAID容錯式獨立磁碟陣列 1
RAID容錯式獨立磁碟陣列 1模式是讓組成RAID容錯式獨立磁碟陣列 1模式的硬碟互為鏡像,這樣當你向硬碟中寫入資料的時候,它會在兩個硬碟上存儲相同的資料,這樣即使其中一個硬碟出現了故障,系統利用另外一個硬碟一樣可以正常執行。RAID容錯式獨立磁碟陣列 1相對於單顆硬碟來說它的資料讀取效能會更好一些,因為當一塊硬碟處於忙的狀態時,RAID容錯式獨立磁碟陣列控制器可以去讀取另一塊硬碟中同樣的資料,但是寫入資料效能不但沒有增長而且可能會有輕微的下降。當其中一塊硬碟出現故障之後,新的資料可以寫入仍然能夠正常工作的硬碟,當使用新的硬碟替換掉原來的硬碟之後,RAID容錯式獨立磁碟陣列控制器會自動的把資料拷貝了新的硬碟至少。 RAID容錯式獨立磁碟陣列 1模式的最大特點就是冗余性高,但是由於大部分的功能是利用軟體來實現的,所以它會增加處理器的負擔。這種RAID容錯式獨立磁碟陣列模式非常適合對於資料的安全性有極高要求的人。
隨機讀取效能:好 隨機寫入效能:好 持續讀取效能:一般 持續寫入效能:好
優點:資料高可靠性,易於實現,設計簡單 缺點:比 RAID容錯式獨立磁碟陣列 0相比速度較慢,特別是寫入速度,另外就是我們僅僅能使用一半的硬碟容量。
RAID容錯式獨立磁碟陣列 0+1
這種RAID容錯式獨立磁碟陣列模式其實是RAID容錯式獨立磁碟陣列 0和RAID容錯式獨立磁碟陣列 1模式的組合,這種模式至少需要4塊硬碟。其中任何兩塊組成一個RAID容錯式獨立磁碟陣列 0磁牒陣列,然後兩個RAID容錯式獨立磁碟陣列 0磁牒陣列可以看成兩個容量更大、速度更快的硬碟,它們在組成一個RAID容錯式獨立磁碟陣列 1磁牒陣列。這樣的系統在保證了較高的磁牒效能和較高的資料安全性。當然缺點也是顯然易見的就是成本較高,構造比較複雜。RAID容錯式獨立磁碟陣列 0+1在容錯效能方面僅次於RAID容錯式獨立磁碟陣列 5,一般的用於文件伺服器等方面。
隨機讀取效能:很好 隨機寫入效能:好 持續讀取效能:很好 持續寫入效能:好
優點:相對於單塊硬碟具有更高的讀寫效能,而且大大提高了資料的安全性 缺點:成本較高,至少需要4塊硬碟
RAID容錯式獨立磁碟陣列 2
RAID容錯式獨立磁碟陣列 2模式也相當的複雜,它的用於存儲資料的硬碟之間以RAID容錯式獨立磁碟陣列 0的模式來組合,另外還有專門存放漢明ECC校驗碼的硬碟,當然為了提高校驗碼資料的安全,校驗碼硬碟至少是兩個組成RAID容錯式獨立磁碟陣列 1模式。這樣即使存儲資料的其中一個硬碟損壞,RAID容錯式獨立磁碟陣列控制器可以通過漢明碼來回複數據到新的硬碟上。 RAID容錯式獨立磁碟陣列 2一般針對於大資料量操作和超級電腦套用等方面,但是並不適於普通用戶。因為要在資料存儲的程序中產生就校驗碼,所以這種磁牒陣列的效能並不高。由於各種原因這種磁牒陣列模式並沒有套用到實際的商業套用中去。因為價格不菲,當然也不會為普通用戶所接受了。
隨機讀取效能:一般
隨機寫入效能:差,主要因為所有的操作都要經過ECC運算
持續讀取效能:很好
持續寫入效能:一般
優點:資料安全性高,只要存放校驗碼的硬碟沒有故障就能恢複數據 缺點:昂貴、需要專門的硬碟存放校驗碼、效率不高、沒有商業套用的支持
RAID容錯式獨立磁碟陣列 3
同 RAID容錯式獨立磁碟陣列 2模式一樣,RAID容錯式獨立磁碟陣列 3的資料也是被分成資料塊依次存儲到多個硬碟上的。只是 RAID容錯式獨立磁碟陣列 3把資料以bit為服務機構來分割並且存儲到各個硬碟上。它的優點就是具有高速的讀寫能力,當然寫入效能因為在寫入的程序中需要產生奇偶校驗碼所以速度會受到一定的影響--它也需要一個專用的硬碟來存儲奇偶校驗碼。當其中一個存儲資料的硬碟故障之後,系統依然能夠正常執行,但是效能會收到影響,如果在更換壞硬碟之前又有一塊硬碟故障,那麼這個磁牒陣列的資料將會全部丟失,無法恢復。在這種磁牒陣列模式下,要求所有的硬碟的轉速要同步,這個要求在實際套用中難度不小。RAID容錯式獨立磁碟陣列 3至少需要3塊硬碟,其中一塊用於存放奇偶校驗碼--奇偶校驗碼是通過異或運算得到的。
這種RAID容錯式獨立磁碟陣列模式如果使用軟體控制器來實現將會明顯的影響效能,因為這中組合比較複雜,不過同RAID容錯式獨立磁碟陣列 0+1模式相比它的最少只要3個硬碟就可以實現--所以成本有所下降,總的來說這種磁牒陣列比較適合視瀕處理和編輯等方面的套用。
隨機讀取效能:好
隨機寫入效能:很差
持續讀取效能:很好
持續寫入效能:一般
優點:比較適合視瀕編輯等需要大資料量使用的場合 缺點:實現各個驅動器的轉速的同步非常的困難(目前大部分的硬碟都不支持這個功能),需要複雜的控制器
RAID容錯式獨立磁碟陣列 4
RAID容錯式獨立磁碟陣列 4模式同 RAID容錯式獨立磁碟陣列 3幾乎是一樣的,資料都是分成小的資料塊依次存儲在多個硬碟之上,奇偶校驗碼存放在獨立的奇偶校驗碟上。唯一不同的是,在資料分割上RAID容錯式獨立磁碟陣列 3是以bit為服務機構而RAID容錯式獨立磁碟陣列 4是以Byte為服務機構。這樣的可以使得RAID容錯式獨立磁碟陣列 4同RAID容錯式獨立磁碟陣列 3具有一樣的讀取速度,當然寫入效能因為需要在寫入程序中產生校驗碼並且存儲到校驗盤而受到了影響。
這種模式的最大的好處就是不需要各個硬碟之間在轉速上保持同步,這就使得控制器不需要那麼複雜。它的寫入效能是所有RAID容錯式獨立磁碟陣列模式中最差的。同RAID容錯式獨立磁碟陣列 3模式一樣,當其中一塊硬碟損壞,資料並不會丟失,如果在故障的硬碟被替換之前,第二塊硬碟也發生故障將會導致所有的資料都丟失。相對於其它的RAID容錯式獨立磁碟陣列模式,恢復故障硬碟中的資料的效率相當的低下。
這種磁牒陣列模式也是至少需要3塊硬碟才能搭建而成。奇偶校驗碼是通過異或運算來得到的。它適於一般的應用程式,包括視瀕處理等套用。它的造價也不算高,因為只要一塊硬碟作為校驗碼磁牒就可以了。
隨機讀取效能: 很好
隨機寫入效能: 一般,主要因為要像奇偶校驗磁牒寫入校驗碼
持續讀取效能: 好
持續寫入效能: 一般
優點:除了 RAID容錯式獨立磁碟陣列 3的優點之外,它並不需要同步驅動器轉速 缺點:寫入效能很差,控制器的要求較高
[引用] [編輯] [刪除] AD : □□□很多游戲的好玩游戲網站□□□
B siwen 發表日期:2004-10-08 17:05:01 ( 1 樓)
RAID 4
RAID 4也使用一個校驗磁牒,但和RAID 3不一樣
RAID 4是以扇區作資料分段,各磁牒相同位置的分段形成一個校驗磁牒分段(parity block),放在校驗磁牒。這種方式可在不同的磁牒平行執行不同的讀取命今,大幅提高磁牒陣列的讀取性能;但寫入資料時,因受限於校驗磁牒,同一時間只能作一次,啟動所有磁牒讀取資料形成同一校驗分段的所有資料分段,與要寫入的資料做好校驗計算再寫入。即使如此,小型檔案的寫入仍然比RAID 3要快,因其校驗計算較簡單而非作位(bit level)的計算;但校驗磁牒形成RAID 4的瓶頸,降低了性能,因有RAID 5而使得RAID 4較少使用。
RAID 5 RAID5避免了RAID 4的瓶頸,方法是不用校驗磁牒而將校驗資料以循環的方式放在每一個磁牒中,
磁牒陣列的第一個磁牒分段是校驗值,第二個磁牒至後一個磁牒再折回第一個磁牒的分段是資料,然後第二個磁牒的分段是校驗值,從第三個磁牒再折回第二個磁牒的分段是資料,以此類推,直到放完為止。圖中的第一個parity block是由A0,A1...,B1,B2計算出來,第二個parity block是由B3,B4,...,C4,D0計算出來,也就是校驗值是由各磁牒 同一位置的分段的資料所計算出來。這種方式能大幅增加小檔案的存取性能,不但可同時讀取,甚至有可能同時執行多個寫入的動作,如可寫入資料到磁牒1而其parity block在磁牒2,同時寫入資料到磁牒4而其parity block在磁牒1,這對聯機交易處理 (OLTP,On-Line Transaction Processing)如銀行系統、金融、股市等或大型資料庫的 處理提供了最佳的解決方案(solution),因為這些應用的每一筆資料量小,磁牒輸出入頻繁而且必須容錯。
事實上RAID 5的性能並無如此理想,因為任何資料的修改,都要把同一parityblock的所有資料讀出來修改後,做完校驗計算再寫回去,也就是RMW cycle(Read-Modify-Write cycle,這個cycle沒有包括校驗計算);正因為牽一而動全身,所以: R:N(可同時讀取所有磁牒) W:1(可同時寫入磁牒數) S:N-1(利用率)
RAID 5的控制比較複雜,尤其是利用硬體對磁牒陣列的控制,因為這種方式的應用比其他的RAID level要掌握更多的事情,有更多的輸出入需求,既要速度快,又要處理資料,計算校驗值,做錯誤校正等,所以價格較高;其應用最好是OLTP,至於用於圖像處理等, 不見得有最佳的性能。
2.磁牒陣列的額外容錯功能:Spare or Standby driver
事實上容錯功能已成為磁牒陣列最受青睞的特性,為了加強容錯的功能以及使系統在磁牒故障的情況下能迅速的重建資料,以維持系統的性能,一般的磁牒陣列系統都可使用熱備份(hot spare or hot standby driver)的功能,所謂熱備份是在建立(configure) 磁牒陣列系統的時候,將其中一磁牒指定為後備磁牒,此一磁牒在平常並不操作,但若陣列中某一磁牒發生故障時,磁牒陣列即以後備磁牒取代故障磁牒,並自動將故障磁牒的資料重建(rebuild)在後備磁牒之上,因為反應快速,加上快取記憶體減少了磁牒的存取, 所以資料重建很快即可完成,對系統的性能影響很小。對於要求不停機的大型資料處理中心或控制中心而言,熱備份更是一項重要的功能,因為可避免晚間或無人值守時發生磁牒故障所引起的種種不便。
另一個額外的容錯功能是壞扇區轉移(bad sector reassignment)。壞扇區是磁牒故障的主要原因,通常磁牒在讀寫時發生壞扇區的情況即表示此磁牒故障,不能再作讀寫,甚至有很多系統會因為不能完成讀寫的動作而當機,但若因為某一扇區的損壞而使工作不能完成或要更換磁牒,則使得系統性能大打折扣,而系統的維護成本也未免太高了。壞扇區轉移是當磁牒陣列系統發現磁牒有壞扇區時,以另一空白且無故障的扇區取代該扇區, 以延長磁牒的使用壽命,減少壞磁牒的發生率以及系統的維護成本。所以壞扇區轉移功能使磁牒陣列具有更好的容錯性,同時使整個系統有最好的成本效益比。其他如可外接電池備援磁牒陣列的快取記憶體,以避免突然斷電時資料尚未寫回磁牒而損失;或在RAID 1時作寫入一致性的檢查等,雖是小技術,但亦不可忽視。
3.硬體磁牒陣列還是軟體磁牒陣列
市面上有所謂硬體磁牒陣列與軟體磁牒陣列之分,因為軟體磁牒陣列是使用一塊SCSI卡與磁牒連接,一般用戶誤以為是硬體磁牒陣列。以上所述主要是針對硬體磁牒陣列,其與軟體磁牒陣列有幾個最大的區別:
l 一個完整的磁牒陣列硬體與系統相接。 l 內裝CPU,與主機並行運作,所有的I/O都在磁牒陣列中完成,減輕主機的工作負載, 增加系統整體性能。 l 有卓越的總線主控(bus mastering)及DMA(Direct Memory Access)能力,加速資料的存取及傳輸性能。 l 與快取記憶體結合在一起,不但增加資料的存取及傳輸性能,更因減少對磁牒的存取而增加磁牒的壽命。 l 能充份利用硬體的特性,反應快速。
軟體磁牒陣列是一個程序,在主機執行,透過一塊SCSI卡與磁牒相接形成陣列,它最大的優點是便宜,因為沒有硬體成本(包括研發、生產、維護等),而SCSI卡很便宜(亦有的軟體磁牒陣列使用指定的很貴的SCSI卡);它最大的缺點是使主機多了很多工作(process),增加了主機的負擔,尤其是輸出入需求量大的系統。目前市面上的磁牒陣列 系統大部份是硬體磁牒陣列,軟體磁牒陣列較少。
4.磁牒陣列卡還是磁牒陣列控制器
磁牒陣列控制卡一般用於小系統,供單機使用。與主機共用電源,在關閉主機電源時存在丟失快取中的資料的的危險。磁牒陣列控制卡只有常用總線方式的接頭,其驅動程序與主機、主機所用的操作系統都有關係,有軟、硬體相容性問題並潛在地增加了系統的不安定因素。在更換磁牒陣列卡時要冒磁牒損壞,資料失落,隨時停機的風險。
獨立式磁牒陣列控制一般用於較大型系統,可分為兩種: 單通道磁牒陣列和多通道式磁牒陣列,單通道磁牒陣列只能接一台主機,有很大的擴充限制。多通道磁牒陣列可接多個系統同時使用,以群集(cluster)的方式共用磁牒陣列,這使內接式陣列控制及單接式磁牒陣列無用武之地。目前多數獨立形式的磁牒陣列子系統,其本身與主機系統的硬體及操作環境? --
首先,IDE的性能不會比SCSI更高的。特別是在多任務的情況下。一般廣告給出的是 最大傳送速度,並不是工作速度。同一時期的IDE與SCSI盤相比,主要是產量比較大, 電路比較簡單,所以價格比SCSI低很多,但要比性能,則差遠了。
RAID並沒有限制使用多少個盤,應時盤越多越好。 對於SCSI結構的RAID來說,盤的最大數量與SCSI通道(SCSI總線)的數量有關一般是每個通道最多裝15個盤(SCSI/3)對於FC-AL(光纖)則是每個通道200個盤當然,要有這樣大的磁牒箱才行!
現在選擇IDE磁牒陣列卡(IDE RAID卡)來確保資料安全的人越來越多,如何正確使用IDE RAID卡也是個學問。下面我們就以採用HPT370A/372控制晶片的Rocket100 RAID卡為例來給大家做些講解常見故障與技巧。
安裝需知
先找一個空閒的PCI插槽將該卡插進去並將硬碟用硬碟線和該卡安裝連接好,安裝完適配卡後,在啟動電腦的過程中,你會看到該適配卡已成功安裝並被系統識別。而在系統開機時,其控制器的BIOS會顯示硬碟狀態的信息,按CTRL+H即可進入結構非常清楚的設置功能表,在這裡你可以設定磁牒陣列:兩個硬碟可以選擇條帶模式(RAID 0)和鏡像模式(RAID 1),有三塊硬碟的話只能選跨越擴充或條帶模式,而四塊就可以選跨越模式、條帶模式或條帶結合鏡像模式(RAID 0+1),而選用RAID 1的話硬碟必須進行同步化。
常見安裝故障排除
當Rocket100 RAID卡被識別後,板上BIOS開始檢測連接設備。請注意螢幕上出現的設備,如果所連接設備全部被正確掃瞄出,則說明設備已正確連接並被系統識別,再安裝好驅動之後你即可使用RAID功能了。而如果其中有的設備沒有被識別出,你可開啟機箱,將所連接設備的電源線是否插牢,必要時換一個電源插頭試一試;所連接設備的資料線是否正確連接並已插牢,必要時換一根資料線試一試;如果一根資料線上接有兩個設備,請確認這兩個設備的主從跳線是否設置衝突(一根資料線上的兩個設備必須為一主一從)。
硬碟容量的選擇
考慮到系統的操作性能及磁牒的利用率,我們建議你最好使同樣容量的硬碟。但你如果一定要用不同容量的磁牒,需要注意的是整個陣列的容量要由該陣列中最小容量的硬碟決定,例如在由3個磁牒組成的RAID 0陣列中,總容量等於最小磁牒的容量的3倍。在RAID 1陣列中,目標盤的容量不能小於源盤的容量。該陣列的總容量就等於最小磁牒的容量。但是JBOD是個例外,兩個或更多的不同容量的硬碟可以組合起來,形成一個邏輯單盤。
BIOS設置須知
IDE RAID卡是即插即用設備,所以,你不必改變系統CMOS。系統會自動指出中斷及端口的地址。而在CMOS設置中將所有設備處於none或unstalled狀態時,即可將IDE RAID卡設為啟動卡;或將SCSI設備調為啟動序列的第1位,也可將RAID卡設為啟動卡。
RAID損壞了怎麼辦
如果一個RAID級別被破壞了,可以按以下操作進行檢查:先電腦關機的電源,檢查硬碟電源的連接,以及資料線是否與硬碟和RAID控制卡連接正常再重新開機;如果以上操作仍不能解決問題,可能是硬碟的問題,對於RAID 1和RAID 0+1,可以用一個新的硬碟將已經被破壞的硬碟上的資料進行備份,所有的資料都不會丟失的。對於RAID 0和JBOD,必須先刪除原有的RAID級別,再進去行RAID新增,但要注意,此動作會使硬碟的所有資料丟失,所以,對RAID 0和JBOD,請務必經常對資料進行備份。
--------------------------------------------------------------------------------
|