標簽:服務器,云計算,數據中心,
在過去二十年中,行業標準服務器設計取得了重大進展,從1993年推出首款機架式服務器開始。從那時起,半導體制造和微處理器架構的技術進步推動了服務器設計的邊界,該行業多年來一直推動性能,功率效率和成本節省的持續改進。按摩爾定律推動,這一進步速度已經成為企業信息技術從2000年代初開始增長和近年來公有云崛起的基石之一。
未來,隨著行業加速從企業向云計算的轉變,正在使用全球規模的公有云服務來構建新的解決方案,為客戶提供全新的產品體驗。提供這種全球規模服務的數據中心基礎設施也在快速發展,硬件技術的相應創新水平不同于之前在行業中所見到的。在公有云的快速增長和擴展工作負載的推動下,我們現在處于計算架構革命的臨界點,這將徹底重新定義“服務器”的經典概念。
新的超高速工作負載的出現
公有云現在在三個主要方面發展:企業工作負載到云遷移的基礎架構即服務(IaaS),用于構建云本機應用程序的平臺即服務(PaaS)專為全球規模的容錯而設計,以及軟件即服務(SaaS),可提供全面的交鑰匙解決方案的云產品。云計算的初始需求主要由IaaS驅動,但最近PaaS和SaaS正在成為破壞性創新的關鍵點,以便在各種市場垂直領域使用這些服務。如用于圖像,視頻和語音處理的機器學習算法的認知服務,用于諸如噴氣發動機和連接汽車的商業場景的物聯網(IoT)服務。
新興的云服務與傳統的“遺留”IaaS應用程序在如何利用底層硬件資源方面截然不同。這些高度并行的工作負載在數據中心的數百臺(有時甚至數千臺)機器上運行,需要大量的網絡帶寬和計算資源。其中一些工作負載流量大量實時數據,需要在存儲之前立即執行。大多數這些工作負載可以完全在服務器的輸入/輸出(I/O)中運行,并且在很多情況下操作不能很好地映射到當前微處理器設計的架構。這些數據中心工作負載的另一個屬性是在大規模服務器與服務器間通信(也稱為數據中心開銷)時,對于所有數據傳輸和閑置數據進行集中操作(如壓縮和加密)所產生的處理開銷。
這些下一代云工作負載正在推動對有效地托管這種分布式橫向擴展應用程序所需的計算架構和硬件架構的全面重新思考。
超越經典的馮諾依曼瓶頸
設計高性能硬件來承載這種超高速服務需要重新評估底層計算架構的基本原理。當前的服務器系統基于馮諾依曼(Von Neumann架構起源于1945年),并且由連接到服務器的計算,內存和輸入/輸出(I/O)設備之間的明顯分隔來定義(見圖1)
▲
在這樣的機器中,馮諾依曼瓶頸被定義為由計算發生在哪里和存儲數據的“chokepoint”產生的對性能的限制。
▲
迄今為止,硬件行業已經使用諸如更大的微處理器高速緩存,多線程,多核和3D封裝等技術解決了這個瓶頸。但瓶頸依然存在,并導致摩爾定律對晶體管的收益效率低下。最終的結果是,目前的服務器設計無法使用過去運行良好的“一刀切”的方法有效地執行全面的云計算工作負載。這對數據中心基礎設施的總體擁有成本(TCO)有重要的影響,業界勢必要將計算范式和相關的硬件設計發展到超越當今馮?諾依曼(Von Neumann)架構的局限。
前方的路
為了滿足這些新的計算挑戰,硬件行業正在響應各種各樣的架構選擇,每個都針對特定Hyperscale工作負載的高性能執行進行調整。一些示例是用于加速計算和網絡處理的FPGA,用于機器學習的GPU和數據流引擎,用于高吞吐量模式處理的內存處理設計和用于人工智能的神經元計算。雖然沒有一個單一的“銀彈”體系結構可以很好地映射到所有的工作負載,但是觀察到的趨勢是經典的馮·諾依曼(Von Neumann)架構與其他計算架構的創新融合。
這是引領行業步入破壞性創新和大規模實驗的新時代。創業公司正在獲得資助,以探索具有定制芯片設計的系統的突破性想法,硅供應商正在大力投資來解決這些新工作負載并擴大其產品路線圖,而大型云服務提供商(CSV)正在部署這樣的混合計算架構,以提供全新的云服務,同時提高運營利潤。這樣的趨勢已經導致很多的兼并和收購,因為現有的玩家需要保持領先并保護其細分市場。隨著這種趨勢的進展,“服務器”的經典概念被重新定義為以前難以想象的方式。
在過去二十年中,服務器行業已經取得了可預測的節奏,隨著摩爾法律的增長而逐漸改善。隨著基于新興Hyperscale服務的云計算和垂直解決方案的增長,未來幾年將見證從傳統服務器設計到針對大規模計算優化的創新型新架構范式的根本性變化。預計這種趨勢將進一步加速公有云服務的采用,因為只有大型CSV才能擁有規模和能力來維持有效設計和提供下一代數據中心基礎架構所需的大量研發投入。我們正處于計算架構革命的邊緣,我們現在所知道的“服務器”將不再存在于這個新興的超級服務領域。
作者:微軟Azure硬件基礎架構總經理Kushagra Vaid
|