我叫服務器,你們休想看到我宕機的樣子

2016-04-22

我叫服務器,承載了全世界互聯網行業的光榮與夢想。最近,聽說居然有人敢質疑我的權威,說我會不會宕機?明確告訴你,你可以罵我卡,但就是不讓你看見我宕機!

 

不是不想休息,而是不能宕機

我們服務器是每一家互聯網企業的支撐,如果支柱倒塌那會是怎樣的災難?所以我們不是不想休息,而是絕對不能宕機!

 

服務器存在的目的與家用電腦是完全不同的兩種,家用電腦存在著不需要使用的時間點,而且這個時間點往往很長,因此家用電腦可以有很長的休眠時間。而服務器則不然,不同公司的服務器對使用時間段不同,這也就使得部分服務器根本不允許有休眠的時間。

 

夜深人靜,依然奮斗的服務器根據數據顯示,金融企業每次宕機的平均損失約為1000萬美金,這還不計無法統計的無形資產損失。一些大型的網站通常會有登錄的高峰階段,例如12306的春運、電商平臺的購物節、新型電子產品的發布等都會給服務器帶來巨大的壓力,宕機對企業就是災難性的打擊。

 

燒香拜佛難免服務器崩潰(圖片來自網絡)我們不是不想宕機,而是使命的存在讓我們不能宕機。此外,優質的外部環境,過硬的自身素質和純凈的軟件環境是保障我們穩定運行絕不宕機的條件。只有住的好,才能不顯老我們服務器的觸覺比你們人類更加挑剔,工作時間比人類更長,因為良好的工作環境是必要條件。

 

谷歌的數據中心在恒濕恒溫準無塵的環境,沒錯,那就是我們最習慣的地方。我們這樣挑剔的電子設備,工作環境必須常年保持在18℃到30℃之間,溫度過高或者過低都將對我們的使用有所影響,加速我們的老化。空氣的流通也是非常重要的,在我們所居住的地方,24小時空調不能停。但是空調是不能保障我們的體溫的。每當我們服務器工作時間長了,渾身上下都會發熱。因此大量的冷卻水給我們進行貼身服務降溫,保障服務器的散熱和機身溫度的穩定。

 

谷歌數據中心,不同顏色的冷卻水我們的工作運行環境,要求至少達到準無塵標準。一般來講,經過長期正常維護的服務器運行十年以上,主板上的積塵也比用幾個月的家用電腦服務器少。只有這樣才能最大限度避免靜電灰對服務器工作可靠性的影響。

 

整潔,干凈,無塵更重要的是,我們的運維人員都非常專業,經常加班加點的對服務器的運行狀況進行監測。以便于一旦發現任何問題,及時處理。否則,宕機也是再所難免。只為不宕機,硬件更專業我們服務器的設計就是為了不宕機而出現的,這一點和家用電腦有著千差萬別。沒有完全不會壞的服務器,我們也會有故障。因此服務器在設計的時候做了大量的備份冗余,維護不會影響到正常工作。以谷歌的數據中心為例,大量的數據服務器都采取了即插即用模塊化的方式設計。每個模塊服務器有著自己的電源。如果某一模塊發生故障,直接換上新的模塊就可以,而不會影響到其他模塊。

 

模塊化設計都有獨自的電源而且,服務器大多數設計為集群架構,即以雙機或者多機熱備。同時運行一個業務時,一臺或者多臺服務器的離線并不會對整體業務造成嚴重的影響。而這也是平時一些人在玩網游時會感覺卡的原因之一,很可能就是某臺服務器偷懶啟用了備用服務器的原因。

 

模塊維修,沒想象的那么難家用電腦可能會有生產商偷工減料節約成本,降低整體價格的現象存在。但是我們服務器領域卻不會這樣。CPU內置多種容錯糾錯機制;內存帶有ECC校驗芯片,數據干擾出錯風險比非ECC內存低很多,采用優質方案是不宕機的關鍵所在。比家用服務器的商業級別的配件好太多,我們所有的零件都是工業級配件。而且從電子元件到電路板都經歷了包括老化測試(高溫高電壓)、振動測試、高溫高濕測試等幾十項可靠性測試。經歷了暴風雨的洗禮的我們卻在溫室中被供養,這就是常年不宕機的秘訣。

 

服務器出廠要經過各種測試一生只做一件事,軟件更純粹我們所運行的系統和普通的家用系統有著本質的區別。無論是windows server、Linux或者更強大的Unix,這些系統本身具有高精確度、簡單化、穩定可靠等特點。

 

windows server 2012工具面而這些服務器系統的精簡程度簡直令人發指。由于服務器不需要外接顯示器,所以一些圖形化的界面服務程序通通被砍掉,甚至連聲卡都不要開啟。相比普通的家用操作系統,這些圖形化的程序往往占用了大量的空間,計算量和復雜程度較高,導致電腦服務器運行緩慢。而大量多余運行項目排除,使得服務器級別操作系統的目的性更明確,甚至有的服務器窮其一生都是在運行一款Apache,壓力比家用電腦小太多。

 

Unix系統沒有圖形化界面,這是搭配的CDE桌面而對于高端的服務器來講,操作系統的容錯性也是完爆家用級別服務器。在家用服務器運行時,一個error彈框就能讓整臺電腦重啟。而服務器如果出現錯誤,后臺自動生成詳細的錯誤分析日志,尋求最佳解決方案保障程序繼續運行下去。

 

讓人目眩的大規模集群架構做單一的工作雖然簡單,但是服務器的處理量是巨大的,這時,大型集群架構就可以發揮他的作用了。一旦服務器負載量增大,大規模集群會讓負載均衡化,保障單個服務器不會過載崩潰,整個系統穩定運行。其實我也宕機,只是不讓你看見當然,我們服務器家族個頭有高有矮,情況不一。一些比較低端的服務器只是針對小范圍的受眾,一旦超出了承載范疇,系統崩潰宕機的事情時有發生。而高端產品也不能完全例外,但是宕機幾率和風險要小太多。

 

不同類型的服務器讓服務器宕機的原因大致可以分為三種。一,天災。服務器所處環境不良,維護不夠及時,甚至供電不良等;二,人禍。各種應用的設置不當,人為操作失誤和破壞以及最常見的大量訪問超出了服務上限,導致服務器崩潰。三,服務器本身原因。服務器質量的差距歸根結底是投入的差距。也就是說,服務器的質量越好,成本越高,相應的價格也就越貴。比如,普通的商業級別服務器價格在3000到10萬間,而Unix服務器的價格則在30萬到3000萬。

 

戴爾Unix服務器價格的提升帶來的是服務器穩定性的提升。高端的Unix服務器已經達到了可用性99.99%的指標。即具備故障自動恢復能力,年停機時間不超過53分鐘。但其超高成本和維護費用也使得很多企業望而卻步。目前,也僅有銀行、證券保險和電信等行業才會采用。那么如此高端的服務器就可以永不宕機了么?事實恐怕并非如此,此類服務器中比較著名的當屬IBM的Z系列服務器。這一款號稱“永不宕機”的服務器在2013年也走下了神壇。中國銀行所使用IBM的Z系列服務器出現了長達4小時的宕機,造成了巨大的損失。

 

銀行所用的IBM Z系列服務器那么大型機也宕機,云服務器宕機么?也會有的。不久前谷歌云剛剛全面中斷18分鐘,而亞馬遜云也曾在2013年出現了40分鐘的宕機。而且相比普通的服務器宕機問題,云服務器會顯得更為嚴重。由于公有云用戶并不具有控制權,所以能做到就只剩下等待和祈禱了。世界上真的完全沒有不宕機的服務器嗎?也是有的,美國2004年發射的機遇號火星探測器,從登陸火星到現在已經十余年,從未發生任何故障。該探測器便是采用雙機冗余接口的方式搭載了兩臺IBM P series服務器。

 

機遇號火星探測器

如果說宕機是偶爾的風雨,那么不宕機才是服務器支撐起整個互聯網行業的脊梁。文章最后,用一張表來為大家總結一下為什么服務器能夠不宕機。


永不宕機在生活中或許只是一個神話,并非每臺服務器都能陪你到老。在經歷了太多的風霜后,宕機在所難免。我們不是不會宕機,只是在努力不想讓你們看見,誰讓我們的名字叫做“服務”呢。


電話

24小時熱線:

4006-371-379

咨詢電話:

0371-55056677

0371-55056699


舉報

“掃黃打非”舉報專區:


您可以通過郵箱舉報的方式向我們舉報不良信息,將舉報類型、舉報網址、舉報IP、舉報描述、違法截圖以及您的聯系方式等信息發送至我們的郵箱:

support@htuidc.com

曰本做爰免费视频