簡(jiǎn)述:現(xiàn)在有很多服務(wù)器托管用戶(hù)想著把服務(wù)器托管給托管商就省去了很多的麻煩事,服務(wù)器托管用戶(hù)不光享受著服務(wù)器托管商給提供的一系列網(wǎng)絡(luò)資源的時(shí)候,而服務(wù)器托管商也要對(duì)數(shù)據(jù)中心進(jìn)行日常的安全維護(hù),以保證用
現(xiàn)在有很多服務(wù)器托管用戶(hù)認(rèn)為服務(wù)器托管給托管人節(jié)省了很多麻煩,服務(wù)器托管用戶(hù)不僅享受服務(wù)器托管人提供的一系列網(wǎng)絡(luò)資源,服務(wù)器托管人還需要日常安全維護(hù)數(shù)據(jù)中心,以確保用戶(hù)能夠享受更好更好的硬件資源支持,所以對(duì)于數(shù)據(jù)中心機(jī)房的維護(hù),用戶(hù)朋友不會(huì)感到復(fù)雜的程度和專(zhuān)業(yè)性。
大型數(shù)據(jù)中心往往包含許多小系統(tǒng),運(yùn)維工作圍繞這些具體的應(yīng)用系統(tǒng),具體可分為基本運(yùn)維管理、日常業(yè)務(wù)運(yùn)維、網(wǎng)絡(luò)、服務(wù)器、存儲(chǔ)、安全六部分,今天本文騰友小彌補(bǔ)一般大型數(shù)據(jù)中心應(yīng)該具備哪些運(yùn)維方法和能力。
第一,從數(shù)據(jù)中心的基本運(yùn)維管理來(lái)看
主要包括硬件配置管理、可維護(hù)性?xún)?yōu)化、監(jiān)控、報(bào)警處理、自動(dòng)化操作和維護(hù)、斷網(wǎng)、斷電、機(jī)房災(zāi)難容忍等操作和維護(hù)工作。硬件配置管理包括機(jī)柜中每個(gè)服務(wù)器的型號(hào)和硬件配置,以及哪些業(yè)務(wù)系統(tǒng)正在使用這些服務(wù)器。即使是虛擬的操作環(huán)境也需要知道這些虛擬機(jī)在由物理機(jī)組成的資源池中流動(dòng)。數(shù)據(jù)中心物理機(jī)和虛擬機(jī)的數(shù)量非常大,因此非常有必要使用自動(dòng)操作和維護(hù)。
自動(dòng)操作和維護(hù)不僅可以提高操作和維護(hù)的工作效率,還可以減少人工參與,同時(shí)讓數(shù)據(jù)中心管理自己,釋放人力。數(shù)據(jù)中心可能的故障也做好監(jiān)控和報(bào)警處理,以便第一次知道問(wèn)題,通常大故障從小故障逐漸擴(kuò)展,最終導(dǎo)致整個(gè)大系統(tǒng)崩潰,所以在一些小異常必須及時(shí)消除,這些異常依賴(lài)于完善的監(jiān)控和報(bào)警系統(tǒng)來(lái)檢測(cè)。
二是考慮數(shù)據(jù)中心的日常業(yè)務(wù)運(yùn)維
主要包括日常檢查、應(yīng)用變更、軟硬件升級(jí)、突發(fā)故障等。具體來(lái)說(shuō):
1.日常檢查:數(shù)千英里的堤壩,潰爛在蟻巢里。任何故障都可能在發(fā)生前發(fā)生,小隱患不能消除,可能導(dǎo)致重大故障。因此,數(shù)據(jù)中心的日常日常檢查工作很無(wú)聊,但也非常重要,可以及時(shí)發(fā)現(xiàn)運(yùn)行中的一些隱患。根據(jù)數(shù)據(jù)中心承載業(yè)務(wù)的不同重要性,定期檢查數(shù)據(jù)中心中的所有運(yùn)行設(shè)備。檢查服務(wù)器應(yīng)用程序服務(wù)是否正常,CPU內(nèi)存和其他利用率是否正常。檢查應(yīng)用程序業(yè)務(wù),看看業(yè)務(wù)運(yùn)行是否正常。還應(yīng)檢查數(shù)據(jù)中心的機(jī)房環(huán)境,環(huán)境溫度、濕度和灰塵是否符合要求??照{(diào)、供電系統(tǒng)運(yùn)行良好,設(shè)備運(yùn)行過(guò)熱,地板、天窗、消防、監(jiān)控為檢查部分??照{(diào)漏水、設(shè)備漏水會(huì)對(duì)數(shù)據(jù)中心的正常穩(wěn)定運(yùn)行造成危害,不能粗心大意。
2.應(yīng)用程序變更:數(shù)據(jù)中心承載的業(yè)務(wù)不會(huì)保持不變。隨著業(yè)務(wù)的多樣化和不斷發(fā)展,經(jīng)常需要調(diào)整業(yè)務(wù),包括服務(wù)器和網(wǎng)絡(luò)設(shè)置。因此,我們需要熟悉服務(wù)器和網(wǎng)絡(luò)設(shè)備的操作Linux服務(wù)器命令和網(wǎng)絡(luò)協(xié)議。根據(jù)應(yīng)用程序的需要,及時(shí)、準(zhǔn)確地進(jìn)行變更。
3.軟硬件升級(jí):數(shù)據(jù)中心設(shè)備的一般運(yùn)行周期為五年,設(shè)備需要逐步淘汰和更換,部分設(shè)備需要升級(jí),因此軟硬件升級(jí)也是維護(hù)工作的一部分。軟硬件升級(jí)需要做好退貨機(jī)制,防止升級(jí)問(wèn)題無(wú)法退貨,業(yè)務(wù)長(zhǎng)期無(wú)法恢復(fù)。當(dāng)接管數(shù)據(jù)中心的維護(hù)工作時(shí),你會(huì)發(fā)現(xiàn)如何會(huì)有這么多的升級(jí),幾乎每個(gè)月都有升級(jí)操作,熬夜升級(jí)工作已經(jīng)成為維護(hù)人員的常見(jiàn)工作。
4.緊急故障:沒(méi)有數(shù)據(jù)中心沒(méi)有故障,在數(shù)據(jù)中心運(yùn)行過(guò)程中會(huì)出現(xiàn)這樣或那樣的問(wèn)題。對(duì)于緊急故障,高水平的維護(hù)人員可以冷靜下來(lái),分析故障的觸發(fā)原因,并迅速找到解決方案。如果在短時(shí)間內(nèi)找不到解決方案,他們也可以在分析之前通過(guò)切換到備用設(shè)備來(lái)恢復(fù)業(yè)務(wù)。此時(shí),高水平的維護(hù)人員對(duì)數(shù)據(jù)中心至關(guān)重要,可以在關(guān)鍵時(shí)刻使用。雖然這些工作看起來(lái)很普通,但不要低估它們。數(shù)據(jù)中心的日常維護(hù)實(shí)際上非常重要,這與整個(gè)數(shù)據(jù)中心業(yè)務(wù)的正常運(yùn)行有關(guān)。只有注意數(shù)據(jù)中心的維護(hù),我們才能給數(shù)據(jù)中心一個(gè)安全的關(guān)系。
第三,考慮數(shù)據(jù)中心網(wǎng)絡(luò)
主要有網(wǎng)絡(luò)硬件設(shè)備,ACL、OSPF、LACP、VIP、協(xié)議分析、流量、負(fù)載平衡、2347層、網(wǎng)絡(luò)監(jiān)控、萬(wàn)兆板卡、核心交換等。網(wǎng)絡(luò)是數(shù)據(jù)中心的重要組成部分,是所有工作運(yùn)行的基本保證。沒(méi)有網(wǎng)絡(luò)數(shù)據(jù)中心,網(wǎng)絡(luò)穩(wěn)定是數(shù)據(jù)中心運(yùn)行和維護(hù)的首要任務(wù)。這里不僅要關(guān)注網(wǎng)絡(luò)的硬件問(wèn)題,還要關(guān)注SDN網(wǎng)絡(luò)的軟件定義。一般傳統(tǒng)IT架構(gòu)中的網(wǎng)絡(luò)根據(jù)業(yè)務(wù)需求部署上線后,如果業(yè)務(wù)需求發(fā)生變化,重新修改相應(yīng)網(wǎng)絡(luò)設(shè)備(路由器、交換機(jī)、防火墻)上的配置是非常繁瑣的。在當(dāng)今互聯(lián)網(wǎng)/移動(dòng)互聯(lián)網(wǎng)快速變化的業(yè)務(wù)環(huán)境下,網(wǎng)絡(luò)的高穩(wěn)定性和高性能不足以滿足業(yè)務(wù)需求,但靈活性和敏捷性更為關(guān)鍵。SDN我們所做的是分離網(wǎng)絡(luò)設(shè)備上的控制權(quán),由集中控制器管理,不依賴(lài)底層網(wǎng)絡(luò)設(shè)備(路由器、交換機(jī)、防火墻),屏蔽底層網(wǎng)絡(luò)設(shè)備的差異,控制完全開(kāi)放,用戶(hù)可以定制任何想要實(shí)現(xiàn)的網(wǎng)絡(luò)路由和傳輸規(guī)則策略,從而更加靈活和智能。
進(jìn)行SDN改造后,無(wú)需重復(fù)配置網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的路由器。網(wǎng)絡(luò)中的設(shè)備本身是自動(dòng)連接的。使用時(shí)只需定義簡(jiǎn)單的網(wǎng)絡(luò)規(guī)則。如果您不喜歡路由器本身的內(nèi)置協(xié)議,您也可以通過(guò)編程修改它,以實(shí)現(xiàn)更好的數(shù)據(jù)交換性能。例如,百度自主開(kāi)發(fā)的交換機(jī)可以直接支持SDN遠(yuǎn)程配置和管理特點(diǎn),實(shí)現(xiàn)在線自動(dòng)配置。未來(lái),自主開(kāi)發(fā)的交換機(jī)將進(jìn)一步與服務(wù)器自動(dòng)化在線相結(jié)合,以提高服務(wù)器的交付和管理效率。網(wǎng)絡(luò)可以說(shuō)是包羅萬(wàn)象的,涉及太多的設(shè)備、協(xié)議和軟件層技術(shù),因此我們也需要不斷學(xué)習(xí)和加深對(duì)網(wǎng)絡(luò)技術(shù)的理解,以便做好網(wǎng)絡(luò)運(yùn)維工作。
第四,考慮數(shù)據(jù)中心服務(wù)器
則主要有文件系統(tǒng)、內(nèi)核參數(shù)調(diào)優(yōu)、各種硬盤(pán)驅(qū)動(dòng)、內(nèi)核版本、Kernel panic等。Linux該系統(tǒng)不僅在服務(wù)器中,而且在網(wǎng)絡(luò)操作系統(tǒng)中占據(jù)主流地位Linux使用系統(tǒng)可以更好地處理服務(wù)器和網(wǎng)絡(luò)設(shè)備的運(yùn)行和維護(hù),Linux是運(yùn)維的基本技能。除了熟悉Linux系統(tǒng)的運(yùn)行還應(yīng)監(jiān)控和管理服務(wù)器的運(yùn)行狀態(tài)和核心運(yùn)行狀態(tài),以減少服務(wù)器故障的發(fā)生。一般來(lái)說(shuō),大型數(shù)據(jù)中心包含數(shù)千臺(tái)服務(wù)器,服務(wù)器幾乎每天都有各種各樣的問(wèn)題。只有深入了解服務(wù)器,才能很好地消除問(wèn)題。
為了防止服務(wù)器故障導(dǎo)致業(yè)務(wù)中斷,虛擬化技術(shù)或集群技術(shù)通常部署在服務(wù)器上。當(dāng)服務(wù)器的物理和硬件出現(xiàn)故障時(shí),業(yè)務(wù)可以平穩(wěn)地切換到其他服務(wù)器,業(yè)務(wù)不會(huì)受到任何影響。這些虛擬化技術(shù)增加了操作和維護(hù)的難度,也需要對(duì)虛擬化技術(shù)進(jìn)行深入的研究。此外,數(shù)據(jù)中心服務(wù)器的定制也是一件非常有意義的事情。云計(jì)算需要大規(guī)模部署,因此服務(wù)器具有更高的部署密度、節(jié)能和易于管理,但對(duì)每個(gè)節(jié)點(diǎn)的計(jì)算能力要求不是很?chē)?yán)格。由于制造商生產(chǎn)的普通服務(wù)器需要適應(yīng)各種應(yīng)用程序,它更考慮性能和可擴(kuò)展性,忽略了成本和能耗。
如果是專(zhuān)門(mén)為云定制的服務(wù)器,將根據(jù)云的特點(diǎn)進(jìn)行優(yōu)化設(shè)計(jì),以更好地滿足用戶(hù)的需求。對(duì)于企業(yè)來(lái)說(shuō),它的好處是顯而易見(jiàn)的。想象一下,即使每個(gè)定制服務(wù)器節(jié)省有限的電力(4電源到2電源),從長(zhǎng)遠(yuǎn)來(lái)看,成本節(jié)約也是顯而易見(jiàn)的。Google服務(wù)器是自己設(shè)計(jì)的,使用定制托盤(pán),內(nèi)部電池作為備用電源,遠(yuǎn)低于傳統(tǒng)服務(wù)器的成本和功耗,這也是為了Google節(jié)省了大量的電費(fèi)。
第五,考慮到數(shù)據(jù)中心存儲(chǔ),架構(gòu)更加多樣化和復(fù)雜
云計(jì)算、虛擬化、大數(shù)據(jù)等相關(guān)技術(shù)進(jìn)入數(shù)據(jù)中心后,存儲(chǔ)發(fā)生了巨大的變化,塊存儲(chǔ)、文件存儲(chǔ)和對(duì)象存儲(chǔ)支持多種數(shù)據(jù)類(lèi)型的讀取;集中存儲(chǔ)不再是數(shù)據(jù)中心的主流存儲(chǔ)架構(gòu)。大量數(shù)據(jù)的存儲(chǔ)訪問(wèn)需要一個(gè)高度可伸縮和可伸縮的分布式存儲(chǔ)架構(gòu)來(lái)實(shí)現(xiàn)。在大規(guī)模系統(tǒng)的支持下,分布式文件系統(tǒng)、分布式對(duì)象存儲(chǔ)等技術(shù)為存儲(chǔ)的各種應(yīng)用程序提供了高度可伸縮、可伸縮、大的彈性支持和強(qiáng)大的數(shù)據(jù)訪問(wèn)性能,由于這些分布式技術(shù)對(duì)標(biāo)準(zhǔn)化硬件的支持,大規(guī)模數(shù)據(jù)中心存儲(chǔ)可以以低成本建設(shè)和運(yùn)行。當(dāng)然,分布式存儲(chǔ)并不是為了取代現(xiàn)有的磁盤(pán)陣列,而是為了量和帶寬的快速增長(zhǎng)。
此外,軟件定義存儲(chǔ)代表了存儲(chǔ)架構(gòu)中軟硬件分離的趨勢(shì),即數(shù)據(jù)層和控制層的分離。對(duì)于數(shù)據(jù)中心用戶(hù)來(lái)說(shuō),通過(guò)軟件實(shí)現(xiàn)存儲(chǔ)資源的管理和調(diào)度,實(shí)現(xiàn)存儲(chǔ)資源的虛擬化、抽象化和自動(dòng)化,完全滿足數(shù)據(jù)中心存儲(chǔ)系統(tǒng)的部署、管理、監(jiān)控和調(diào)整要求,使存儲(chǔ)系統(tǒng)具有靈活性、自由性和高可用性的特點(diǎn)。企業(yè)和互聯(lián)網(wǎng)數(shù)據(jù)以每年50%的速度增長(zhǎng)。新數(shù)據(jù)中的結(jié)構(gòu)化數(shù)據(jù)總量有限,其中大部分為非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)。隨著業(yè)務(wù)的發(fā)展,數(shù)據(jù)中心存儲(chǔ)架構(gòu)還需要強(qiáng)大的彈性適應(yīng)性。低成本、大規(guī)模擴(kuò)展和高并發(fā)性能是大型云數(shù)據(jù)中心運(yùn)營(yíng)存儲(chǔ)架構(gòu)的基本技術(shù)屬性。如何進(jìn)行大量、混亂的數(shù)據(jù)存儲(chǔ)和深度應(yīng)用,快速提取有價(jià)值的信息,形成各類(lèi)企業(yè)的生存決策,是未來(lái)存儲(chǔ)和圍繞大型云數(shù)據(jù)中心運(yùn)營(yíng)存儲(chǔ)架構(gòu)的基本技術(shù)屬性。
第六,考慮數(shù)據(jù)中心的安全
安全是幾個(gè)小項(xiàng)目:攻擊保護(hù)、升級(jí)備份、抓BUG/找BUG、腳本工具、數(shù)據(jù)安全、服務(wù)檢查等項(xiàng)目實(shí)際上包含了大量的內(nèi)容。例如,在攻擊和保護(hù)方面,主要是指防止外國(guó)異常入侵者對(duì)數(shù)據(jù)中心發(fā)起的惡意和無(wú)意攻擊。惡意攻擊是指有人故意使用各種攻擊方法進(jìn)入數(shù)據(jù)中心,竊取或破壞重要數(shù)據(jù),以達(dá)到其無(wú)法告人的目的。
也有一些無(wú)意的攻擊,因?yàn)檎麄€(gè)數(shù)據(jù)中心應(yīng)該與外部世界保持互聯(lián),運(yùn)行是動(dòng)態(tài)和變化的,不可避免地會(huì)有一些異常的流量攻擊數(shù)據(jù)中心,有時(shí)甚至來(lái)自數(shù)據(jù)中心,如一些服務(wù)器中毒,或硬件故障,構(gòu)建環(huán)路、異常流量和其他網(wǎng)絡(luò)故障,這些都會(huì)影響數(shù)據(jù)中心的運(yùn)行,所以如何做好數(shù)據(jù)中心的攻擊和保護(hù)是一個(gè)大問(wèn)題,這不是在數(shù)據(jù)中心部署幾個(gè)安全設(shè)備,需要對(duì)整個(gè)數(shù)據(jù)中心進(jìn)行全面、統(tǒng)一的規(guī)劃,并有針對(duì)性地部署一些安全保護(hù)措施,隨著各種黑客技術(shù)的改進(jìn),安全保護(hù)措施也應(yīng)不斷改進(jìn),這是一個(gè)不斷學(xué)習(xí)和改進(jìn)的過(guò)程,只要數(shù)據(jù)中心仍在運(yùn)行,這種改進(jìn)就不會(huì)停止。為了方便操作和維護(hù),還應(yīng)做一些執(zhí)行腳本,以便在緊急情況下快速處理問(wèn)題。
例如,數(shù)據(jù)中心的業(yè)務(wù)異常。為了快速恢復(fù)業(yè)務(wù),需要調(diào)整路由,并將所有流量引入其他數(shù)據(jù)中心,這需要在核心路由器上進(jìn)行調(diào)整。此時(shí),現(xiàn)成的腳本可以自動(dòng)執(zhí)行,以實(shí)現(xiàn)快速切換的目的。數(shù)據(jù)中心還應(yīng)準(zhǔn)備大量其他工作腳本,以便在緊急情況下快速使用。
鄭州騰佑科技有限公司是鄭州的專(zhuān)業(yè)人士IDC真正7的服務(wù)提供商*24小時(shí)技術(shù)支持,機(jī)房技術(shù)。電信、聯(lián)通(網(wǎng)通)
騰佑科技(www.mubashirfilms.com)成立于2009年,總部位于河南鄭州,是一家集互聯(lián)網(wǎng)基礎(chǔ)設(shè)施及軟硬件于一體化的高新技術(shù)企業(yè),具有IDC/ISP/ICP/云牌照、雙軟等資質(zhì),并擁有多個(gè)國(guó)家版權(quán)局認(rèn)證。公司自成立以來(lái),一直致力于發(fā)展互聯(lián)網(wǎng)IDC數(shù)據(jù)中心DataCenter、云計(jì)算Cloud、大數(shù)據(jù)BigDate、人工智能AI、內(nèi)容加速CDN、互聯(lián)網(wǎng)安全、軟件定制開(kāi)發(fā)等產(chǎn)品服務(wù)及行業(yè)客戶(hù)技術(shù)一體化智能解決方案;2018年成為百度智能云AI河南服務(wù)中心。
售前咨詢(xún)熱線:400-996-8756
備案提交:0371-89913068
售后客服:0371-89913000
搜索詞
熱門(mén)產(chǎn)品推薦