更正錯誤記憶體

本页使用了标题或全文手工转换,现处于繁体转换模式
出自求聞百科
ECC RAM 每面均有9枚記憶體顆粒,比普通的多1枚

更正錯誤記憶體(英語:Error-Correcting Code memory,縮寫:ECC memoryECC)指能夠實現錯誤檢查和糾正錯誤技術的內存。

技術原理

在ECC技術出現之前,內存中應用最多的另外一種錯誤檢查技術,是奇偶校驗位技術。

數位電路中,最小的數據單位是「比特(bit)」,也叫「位元」。「比特」也是內存中的最小單位,它是通過「1」和「0」來表示數據高、低電頻信號。在數字電路中8個連續的比特是一字節,不帶「奇偶校驗」的內存中的每個字節只有8位,若它的某一位存儲出了錯誤,就會使其中存儲的相應數據發生改變而導致應用程序發生錯誤。

而帶有「奇偶校驗」的內存在每一字節(8位)外又額外增加了一位用來進行錯誤檢測。比如一個字節中存儲了某一數值(1、0、1、0、1、0、1、1),把這每一位相加起來(1+0+1+0+1+0+1+1=5)。對於偶校驗,若其結果是奇數,校驗位就定義為1,反之則為0;對於奇校驗則相反。當CPU返回讀取存儲的數據時,它會再次相加前8位中存儲的數據,計算結果是否與校驗位相一致。當CPU發現二者不同時就會試圖糾正這些錯誤。

但奇偶校驗位技術有個缺點,當內存查到某個數據位有錯誤時,由於不一定能確定錯誤在哪一個位,也就不一定能修正錯誤。所以帶有奇偶校驗的內存的主要功能僅僅是「發現錯誤」,並不能糾正錯誤。

此外,奇偶校驗技術是通過在原來數據位的基礎上增加一個數據位來檢查當前8位數據的正確性,但隨着數據位的增加,用來檢驗的數據位也成倍增加,就是說當數據位為16位時它需要增加2位用於檢查,當數據位為32位時則需增加4位,依此類推。特別是當數據量非常大時,數據出錯的幾率也就越大,對於只能糾正簡單錯誤的奇偶檢驗的方法就顯得力不從心了。正是基於這樣一種情況,錯誤檢查和糾正(Error Checking and Correcting)應運而生了。

ECC與奇偶校驗不同的是,如果數據位是8位,則需要增加5位來進行ECC錯誤檢查和糾正。數據位每增加一倍,ECC只增加一位檢驗位。也就是說當數據位為16位時ECC位為6位,32位時ECC位為7位,數據位為64位時ECC位為8位,依此類推。在內存中ECC能夠容許錯誤,並可以將錯誤自動更正,使系統得以正常的操作,不致因錯誤而中斷。

誤解

部份人認為伺服器必須使用ECC內存,認為ECC內存效能較高,其實是一種謬誤。ECC內存之所以廣泛應用於伺服器領域,並非其效能,而是因為ECC內存的糾錯能力,使伺服器保持穩定。

ECC本身並不是一種內存型號,也不是一種內存專用技術,它是一種廣泛應用於各種領域的計算機中的糾錯技術。

備註

截止到2020年8月9日,帶ECC校驗的內存還得要電腦其他部件支持才能正常使用,例如主板和CPU[1](並且可能要在BIOS中進行相應的設置),應用在大多數服務器CPU和主板上(一些非服務器CPU和主板也支持)。還有,在購買ECC內存時,需注意是ECC UDIMM、ECC RDIMM、ECC LRDIMM、ECC 3DS RDIMM還是其他,因為你的電腦其他部件可能不支持某些種類。

參考文獻

  1. Server Memory: Types and Performance | Crucial.com. Crucial. [2020-08-09] (美國英語). 

外部連結