12年老牌互聯(lián)網(wǎng)IT解決方案提供商
騰佑科技咨詢熱線咨詢熱線: 400-996-8756
工單提交 注冊(cè)/登錄
百度云服務(wù)中心騰佑科技公司
云服務(wù)器活動(dòng) 服務(wù)器租用 服務(wù)器托管 機(jī)柜租賃 帶寬租賃
  • 最新資訊
  • 熱門資訊
  • 最熱資訊
智能建站

服務(wù)器內(nèi)存如何增強(qiáng)可靠性和可用性

發(fā)布時(shí)間:2013-12-13 17:19 作者:admin

簡(jiǎn)述:

由于大家的注意力大多集中在服務(wù)器的處理能力、網(wǎng)絡(luò)帶寬和存儲(chǔ)IOPS(每秒輸入輸出操作)上,所以很容易忽視服務(wù)器內(nèi)存的可用性和可靠性。雖然處理器是任何服務(wù)器的核心部件,但是工作負(fù)載的所有指令和數(shù)據(jù)都存儲(chǔ)在內(nèi)存中。

在如今的虛擬化數(shù)據(jù)中心中,單單一臺(tái)服務(wù)器可能運(yùn)行眾多虛擬機(jī),而每個(gè)虛擬機(jī)作為一個(gè)文件駐留在內(nèi)存中。但是當(dāng)新的服務(wù)器添置更多更快的內(nèi)存以滿足更大的計(jì)算需求時(shí),內(nèi)存可靠性問題就顯得尤為重要。IT人員必須留意內(nèi)存故障,并充分利用旨在增強(qiáng)內(nèi)存可用性的服務(wù)器特性。

如今,企業(yè)級(jí)服務(wù)器采用數(shù)TB的64位內(nèi)存,這些預(yù)制模塊遵守聯(lián)合電子設(shè)備工程委員會(huì)(JEDEC) DDR3和DDR3L(低電壓)標(biāo)準(zhǔn)而設(shè)計(jì)和制造。這樣一來,企業(yè)很容易從諸多內(nèi)存廠商購(gòu)得價(jià)位合理的內(nèi)存,但是遵守標(biāo)準(zhǔn)并不能保證可靠性。

內(nèi)存可靠性面臨的最大威脅并不是徹底的故障,不過可能會(huì)出現(xiàn)生產(chǎn)缺陷、電事件及其他物理異常引起的故障。確切地說,服務(wù)器內(nèi)存面臨的最大威脅來自隨機(jī)比特錯(cuò)誤——某個(gè)比特出現(xiàn)自發(fā)逆轉(zhuǎn)。要是未加以檢查,僅僅一個(gè)比特出現(xiàn)錯(cuò)誤就會(huì)以突如其來、可能災(zāi)難性的方式,改動(dòng)指令或改變數(shù)據(jù)流。

比特錯(cuò)誤會(huì)自然發(fā)生。內(nèi)存模塊的錯(cuò)誤率從每兆字節(jié)內(nèi)存每小時(shí)大約1比特(有時(shí)被標(biāo)為1010 errors/bit*h)到每兆字節(jié)內(nèi)存每百年1比特(1017 errors/bit*h)不等。這個(gè)范圍相差得太大了,但隨著內(nèi)存子系統(tǒng)速度變快、電氣操作電壓變低以及服務(wù)器上的內(nèi)存總量增加,比特被“誤解”并影響工作負(fù)載的可能性隨之變得相當(dāng)大。

其他因素也會(huì)加劇單比特錯(cuò)誤,比如本底輻射(阿爾法粒子)、寄生電事件(如附近電磁干擾)、糟糕的主板屏蔽或設(shè)計(jì),甚至DIMM插座上的電觸點(diǎn)受到破損或質(zhì)量低劣。

增強(qiáng)內(nèi)存可用性的特性

缺少可用內(nèi)存始終是個(gè)問題,而奇偶校驗(yàn)等錯(cuò)誤檢測(cè)技術(shù)已存在了好多年。奇偶校驗(yàn)很簡(jiǎn)單,對(duì)于檢測(cè)單比特錯(cuò)誤也很有效,但它糾正不了單比特錯(cuò)誤,所以沒有大量地應(yīng)用于服務(wù)器。幸好,現(xiàn)在有或正出現(xiàn)另外許多特性,有助于增強(qiáng)內(nèi)存可靠性。不妨考慮以下幾種方案:

ECC。系統(tǒng)廠商們不是依賴奇偶校驗(yàn),而是依賴糾錯(cuò)碼(ECC)技術(shù)。ECC立足于奇偶校驗(yàn)的基礎(chǔ)上,它使用一種算法,為每64比特的內(nèi)存創(chuàng)建和存儲(chǔ)一個(gè)8比特碼(每個(gè)地址總共72比特)。這種算法和編碼讓系統(tǒng)得以實(shí)時(shí)檢測(cè)和糾正單比特錯(cuò)誤,此外還能檢測(cè)多比特錯(cuò)誤,并防止系統(tǒng)使用破損數(shù)據(jù)。ECC通常是許多通用服務(wù)器上采用的確保內(nèi)存可靠性的默認(rèn)技術(shù)。

先進(jìn)ECC。先進(jìn)ECC把ECC方法擴(kuò)大到了多種內(nèi)存設(shè)備,讓ECC得以檢測(cè)和糾正多比特故障,只要這些故障出現(xiàn)在同一個(gè)內(nèi)存設(shè)備里面。不過,ECC和先進(jìn)ECC并不支持任何一種故障切換機(jī)制,所以為了排除有問題的內(nèi)存模塊,仍得關(guān)閉系統(tǒng)(或依賴其他系統(tǒng)技術(shù))。許多企業(yè)級(jí)服務(wù)器可以提供某種先進(jìn)ECC,比如IBM ProLiant或戴爾PowerEdge。

內(nèi)存錯(cuò)誤跟蹤。應(yīng)對(duì)內(nèi)存錯(cuò)誤的一方面是,首先密切跟蹤內(nèi)存錯(cuò)誤。新興的服務(wù)器設(shè)計(jì)通過為錯(cuò)誤率和位置做一份列表,開始密切跟蹤可以糾正的錯(cuò)誤。一些服務(wù)器還能將錯(cuò)誤信息保存在內(nèi)存模塊上的可重寫串行存在檢測(cè)(SPD)內(nèi)存空間——可以讀取該內(nèi)存空間,以便將來評(píng)估和分析。一旦系統(tǒng)能跟蹤可以糾正的內(nèi)存錯(cuò)誤,并將該信息轉(zhuǎn)移到系統(tǒng)的管理工具,就有可能通過記下錯(cuò)誤率突然增加的DIMM來預(yù)測(cè)可能發(fā)生的內(nèi)存故障。錯(cuò)誤跟蹤稱得上是更先進(jìn)的內(nèi)存可靠性特性的先驅(qū),更先進(jìn)的特性包括DIMM故障切換或在物理內(nèi)存空間里面轉(zhuǎn)移數(shù)據(jù)。

熱備用內(nèi)存。熱備用概念在磁盤存儲(chǔ)領(lǐng)域很常見,但只是最近才在服務(wù)器設(shè)計(jì)流行起來。這是由于系統(tǒng)必須有一定的智能,才能先識(shí)別和跟蹤可以糾正的內(nèi)存錯(cuò)誤,之后才能決定把數(shù)據(jù)轉(zhuǎn)移到備用內(nèi)存模塊上。內(nèi)存錯(cuò)誤跟蹤方面的技術(shù)進(jìn)步讓服務(wù)器的內(nèi)存控制器得以將數(shù)據(jù)從存在的錯(cuò)誤不可接受的DIMM轉(zhuǎn)移到同一通道中的另一個(gè)備用DIMM上。這也叫內(nèi)存插槽備用(rank sparing)。這種方法存在的不足是,為錯(cuò)誤發(fā)生前一直非生產(chǎn)性的服務(wù)器增添內(nèi)存需要一筆開支。

設(shè)備標(biāo)記(Device tagging)。一種內(nèi)存故障切換技術(shù)是基于BIOS的技術(shù),名為設(shè)備標(biāo)記。當(dāng)系統(tǒng)跟蹤到出現(xiàn)錯(cuò)誤率增加的內(nèi)存模塊時(shí),系統(tǒng)基本上就能把數(shù)據(jù)從有問題的內(nèi)存轉(zhuǎn)移到ECC內(nèi)存——實(shí)際上使用ECC內(nèi)存作為一個(gè)小小的熱備用內(nèi)存。這有望減少內(nèi)存故障,但同時(shí)無法在這部分內(nèi)存里面進(jìn)行錯(cuò)誤檢測(cè)和糾正。設(shè)備標(biāo)記被用作一種權(quán)宜之計(jì),讓系統(tǒng)保持運(yùn)行,直到有問題的內(nèi)存模塊被換掉為止。

內(nèi)存鏡像。完美的內(nèi)存可靠性技術(shù)就是把服務(wù)器上內(nèi)存中內(nèi)容從一個(gè)通道復(fù)制到另一個(gè)配對(duì)通道上。這實(shí)際上就是為內(nèi)存建立了RAID 1機(jī)制。如果一個(gè)通道的內(nèi)存里面出現(xiàn)故障,內(nèi)存控制器就會(huì)切換到配對(duì)通道上,沒有任何干擾;完成修復(fù)工作(如果需要修復(fù))后,通道就可以重新進(jìn)行同步。鏡像方法的缺點(diǎn)與存儲(chǔ)方面的RAID 1一樣;由于內(nèi)存中的內(nèi)容被復(fù)制,存儲(chǔ)容量減少了一半,或者說內(nèi)存成本實(shí)際上翻了一番。

如今內(nèi)存在現(xiàn)代虛擬化服務(wù)器中扮演更關(guān)鍵的角色,所以應(yīng)對(duì)和緩解內(nèi)存錯(cuò)誤的破壞性效應(yīng)顯得比以往更為重要。IT專業(yè)人員可以使用一系列不斷完善的內(nèi)存可靠性特性,但是他們必須先對(duì)內(nèi)存可用性方面的需求進(jìn)行更認(rèn)真地評(píng)估,然后再部署擁有的特性可以滿足那些需求的服務(wù)器。
騰佑科技作為國(guó)內(nèi)頂級(jí)互聯(lián)網(wǎng)基礎(chǔ)應(yīng)用服務(wù)提供商,有自己的自主機(jī)房和產(chǎn)權(quán),擁有雙線服務(wù)器,擁有大型的機(jī)房三座,順應(yīng)時(shí)代發(fā)展和客戶需求,在服務(wù)器托管服務(wù)器租用方面,具備多項(xiàng)優(yōu)勢(shì),特別適用于對(duì)網(wǎng)站運(yùn)行質(zhì)量有較高要求的用戶。而且有自己成熟的虛擬化技術(shù),虛擬主機(jī)租用穩(wěn)定安全,推出了自助建站智能建站,省去了您建站的煩惱。經(jīng)過一部分客戶的試用,贏得了一致好評(píng)。推出cdn加速、機(jī)柜租用、帶寬租用等業(yè)務(wù),同時(shí)提供域名注冊(cè)服務(wù),歡迎廣大客戶來電咨詢。
騰佑科技為了最大限度的滿足了全國(guó)各地的客戶對(duì)服務(wù)器租用托管的各種需求,使網(wǎng)絡(luò)的傳遞速度更快速更便捷。正是由于它穩(wěn)定、快速的IDC機(jī)房服務(wù),騰佑科技才能贏得眾多公司的認(rèn)可。騰佑科技是你服務(wù)器托管服務(wù)器租用的最佳的選擇。
由www.mubashirfilms.com提供

點(diǎn)擊展開全文

騰佑科技(www.mubashirfilms.com)成立于2009年,總部位于河南鄭州,是一家集互聯(lián)網(wǎng)基礎(chǔ)設(shè)施及軟硬件于一體化的高新技術(shù)企業(yè),具有IDC/ISP/ICP/云牌照、雙軟等資質(zhì),并擁有多個(gè)國(guó)家版權(quán)局認(rèn)證。公司自成立以來,一直致力于發(fā)展互聯(lián)網(wǎng)IDC數(shù)據(jù)中心DataCenter、云計(jì)算Cloud、大數(shù)據(jù)BigDate、人工智能AI、內(nèi)容加速CDN、互聯(lián)網(wǎng)安全、軟件定制開發(fā)等產(chǎn)品服務(wù)及行業(yè)客戶技術(shù)一體化智能解決方案;2018年成為百度智能云AI河南服務(wù)中心。

售前咨詢熱線:400-996-8756

備案提交:0371-89913068

售后客服:0371-89913000

熱門活動(dòng)

百度云服務(wù)中心
  • 熱門資訊
  • 隨便看看