標簽:服務器,IBM,小型機,power,
7月底,橡樹嶺國家實驗室開始接收第一批服務器,這些服務器最終將擴展成為“Summit”超級計算機,這是人們期待已久的的“Titan”混合CPU-GPU系統,由“Cray”構建并于2012年秋季安裝。因此,從技術上講,IBM已經開始出貨其基于Power9的Witherspoon系統。
鑒于IBM正在將Summit節點發送到橡樹嶺,并且已經開始向勞倫斯利弗莫爾國家實驗室發送類似(但不同的)節點,用于“Sierra”超級計算機,我們預計將有一些類似Power9服務器的公告。這樣的聲明目前還沒有,有可能在9月下旬或10月的某個時候宣布。
隨著英特爾在7月份將“Skylake”Xeon SP處理器正式關閉, AMD將Epyc X86服務器處理器和配套的Radeon Instinct 加速器形成組合拳發布,英特爾恐怕是無法做到這一點的。因此,對于IBM的Power9系統來說,發布宜早不宜遲。毫無疑問,支持IBM自己的AIX Unix和IBM i(以前的OS / 400)專有操作系統/數據庫平臺的Power9系統將到2018年初才會到來,可能是3月或4月。但這并不意味著在年底之前,IBM無法推出Linux的Power9系統,其中最有可能瞄準利潤豐厚的HPC和AI市場。
Power9芯片有兩種類型,一種是“Nimbus”Power9擴展處理器,具有一個,兩個或四個插槽這三種,另一種是 “Cumulus” Power9擴展處理器,具有四個,八個或十六個插槽這三種。
自從2016年中期以來,IBM已經表示,在2020年打開電源芯片路線圖的時候,應該預計到今年下半年將有Power9系統出貨,并且推測不僅僅是Summit和Sierra,對于其他希望通過NVLink互連去部署Power9 CPUs和英偉達的Tesla V100 GPU協處理器緊密耦合的組織,也希望得到美國能源部的資助 。Intel Xeon或AMD Epyc處理器無法實現緊密耦合,因為到目前為止,CPU上沒有像Power9芯片一樣的本地NVLink端口。
IBM各式樣的機器都是用Power8和Power8 +處理器,我們懷疑,Big Blue及其主板和系統合作伙伴,包括OpenPower聯盟的眾多成員,將會帶來大量機器用Power9芯片。IBM無疑將在2018年期間推出一系列Power9機器,并可能從2017年底開始,但是確切的交付時間尚未公布。
Minksy系統在開發時有“Garrison”的代號,之后被賣給HPC。它有兩個Power8 +芯片,兩個NVLink 1.0端口和四個“Pascal”特斯拉P100加速器。兩個Pascal通過NVLink端口直接鏈接到每個Power8 +芯片,然后剩余的NVLink端口用于將系統中的GPU交叉連接在一起,以便它們可以以80 GB /秒的速率共享數據。這個設計就像OpenPower營地的其他Power8系統一樣,把主內存放在一個轉接卡和內存緩沖芯片上,就像IBM為自己的設計那樣。
傳言說,在每個節點上都有兩個Power9處理器和四個Volta加速器。但勞倫斯·利弗莫爾(Lawrence Livermore)對這臺機器的精確速度一直保持沉默,但他說,Sierra將在大約120個petaflops的地方交付150個petaflops,其總內存約為2PB至2.4 PB。
該內存容量不包括每個Volta協處理器上的16 GB HBM2內存。HBM2內存的帶寬為900 GB /秒,就應用程序而言,這很重要。Power9處理器上的主存儲器更像是GPU的L3高速緩存,一旦開啟了一致性,Power9系統中的所有其他緩存(包括Centaur緩沖區芯片中的L4緩存)只是暫存 GPU,直到他們做了有關C語言或Fortran語言相關的工作。
正如之前報道的,橡樹嶺的Summit超級計算機將會對兩個Power9芯片與六個Volta GPU加速器進行配對。橡樹嶺說,它將從大約4,600個節點上建立峰會,比幾年前的估計高出一點,每個節點將擁有512 GB的主內存和800 GB的閃存。2.24 PB主存儲器,3.5 PB的閃存,以及集群中將近72 GB的HBM2內存,將與100 Gb /秒的EDR InfiniBand連接。這些額外的GPU將Summit機器的功率范圍推至大約13兆瓦,并且應該在雙精度的情況下交付約207千萬億次的峰值性能。橡樹嶺一直在計劃每個節點每秒大約40個petaflops,但它看起來像是45個petaflops。
如果不得不猜測,我們會說IBM將使用一致的命名約定,并將電力系統系列中的8替換為認知系統行中的9,因此該機器應稱為HPC認知系統922LC。這將是IBM為其他客戶正式推出的第一臺機器,宜早不宜遲。它不能讓英特爾和AMD壟斷所有的處理器,它必須為Power9的推出奠定基礎,這無疑將在2018年發生,包括針對其核心企業客戶的服務器。
我們預計,HPC的認知系統922LC將采用高核心數和低線程的芯片,并利用沒有Centaur緩沖芯片的行業標準內存來降低成本。 Power9芯片設計有24個內核,它將取決于Globalfoundries的產量,使用其14納米工藝,以查看Summit和Sierra節點以及銷往其他節點的產品是否具有SMT4技術。
我們懷疑未來認知系統系列的其他成員將使用Volta加速器的PCI-Express版本,并擴展其他類型的PCI-Express卡,甚至是NVM-Express存儲,這在數據中心中將變得越來越重要。IBM在其服務器同行之間首先支持PCI-Express 4.0協議,他的帶寬是PCI-Express 3.0的兩倍,并在十六個通道適配器插槽上提供64 GB /秒的總帶寬。如果IBM將要轉售谷歌和Rackspace Hosting創建的“Zaius”主板,我們也很好奇,美國超微電腦股份有限公司(Supermicro)是否會推出去年支持Power 8芯片的 “Briggs”和“Stratton”系統相關的后續工作。
Power7,Power7 +和Power8系統過去的部署不一定表明IBM將如何推出Power9系統。但是總的來說,IBM并不會同時啟動所有的機器,也沒有理由相信它會這樣做。很大程度上將取決于IBM認為所需求的位置,以及Globalfoundries在Power9 Nimbus和Cumulus芯片上的收益。
好消息是,IBM可以通過SMT4線程(每個核心四個線程)或12個內核與SMT8線程(每個核心8個線程)相匹配的方式來優化一個芯片,因此可以在線程數和內核數間保持平衡。SMT4針對Linux工作負載,而SMT8內核主要面向AIX和IBM i。它還可以根據需要在這兩種不同類型的平臺上以不同的帶寬和容量在緩沖內存或無緩沖內存中進行撥號撥打緩沖或無緩沖的內存。
|