由119個預制化集裝箱拼接而成,總功耗達到10MW,先進液冷與綠色電力相結合使得PUE低至1.1以下,結構材料80%可循環(huán)利用,運維基本實現(xiàn)自動化、智能化……這樣一個規(guī)模龐大、綠色環(huán)保且運維智能的智算中心,很難想象從建設到正式投運僅用了120天。近日,元腦“算力工廠”首次亮相,其所創(chuàng)造的效率奇跡,揭示了人工智能時代大規(guī)模及超大規(guī)模智算中心建設模式的變革已然發(fā)生。
元腦算力工廠采用預制化AIDC解決方案,通過預制化、模塊化的創(chuàng)新基建模式,將同等規(guī)模智算中心的建設周期從18個月縮減至4個月,工期縮短了近80%,實現(xiàn)智算中心的快速交付,滿足業(yè)務快速上線需求;智算中心部署了高密智算算力倉,包括50kW負載的風冷機柜和130kW負載的液冷機柜,實現(xiàn)智算中心的高密部署與綠色節(jié)能。
浪潮信息副總經(jīng)理趙帥認為,隨著人工智能應用加速落地,傳統(tǒng)數(shù)據(jù)中心建設方式將會被新的算力工廠模式所替代。一方面,傳統(tǒng)數(shù)據(jù)中心長周期建設模式,已無法滿足算力快速迭代、應用創(chuàng)新加速、業(yè)務即時上線的迫切需求。同時,芯片功耗持續(xù)攀升與大模型應用開發(fā)帶來算力需求爆炸的雙重壓力之下,算力特別是智能算力需要更加創(chuàng)新的“高密+綠色”部署模式。因此,必須從預制化、模塊化、高密化、綠色化等方面著手,全方位推動技術革新與結構優(yōu)化,實現(xiàn)智算中心的快速交付、高密度部署和綠色降碳,算力工廠的模式將成為智算中心建設的主流。
以預制化、模塊化創(chuàng)下120天交付“奇跡”
元腦算力工廠創(chuàng)造的效率“奇跡”背后,是預制化AIDC解決方案對傳統(tǒng)數(shù)據(jù)中心建設模式的顛覆性變革。
一般來說,傳統(tǒng)數(shù)據(jù)中心的建設需要經(jīng)過設計、土建、機電安裝、調試等多個階段,其規(guī)劃及建設周期通常在3年以上。但是當前算力技術迭代非?欤酒瑒(chuàng)新周期基本實現(xiàn)每年迭代,應用創(chuàng)新周期更是壓縮至數(shù)月甚至數(shù)周。如果沿用傳統(tǒng)建設模式,不僅很難做到第一時間升級新一代技術,更無法及時實現(xiàn)業(yè)務的智能化升級,數(shù)據(jù)中心會面臨建成即落后,現(xiàn)實算力需求超預期卻難擴容的窘境。
元腦算力工廠所采用的先進預制化AIDC解決方案,實現(xiàn)了數(shù)據(jù)中心模塊的高度預制化,所有機電設備在工廠預集成、預測試,接入市電、網(wǎng)絡和水源即可獨立運行,預制裝配率高達90%,且集成工作與現(xiàn)場土建工作并行,在極大降低對場地空間要求的同時,相比傳統(tǒng)土建機房工期可縮短80%左右,解決了傳統(tǒng)數(shù)據(jù)中心建設周期長、無法滿足業(yè)務快速上線的問題。
同時,元腦算力工廠也實現(xiàn)了高度模塊化,針對數(shù)據(jù)中心功能進行了細化分區(qū),設計出IT、電力、集成冷站、液冷冷源、辦公、走廊、電梯、樓梯等八種模塊化的功能箱體,可根據(jù)場景、規(guī)模靈活組合,并按照功率區(qū)段分區(qū)部署,實現(xiàn)風冷/液冷、AI/通用/高密度等多種形態(tài)靈活兼容,智算算力、通用算力、邊緣算力全場景覆蓋。
高密+綠色的智算中心設計,持續(xù)提高全向Scale 能力
元腦算力工廠的領先性當然不僅僅體現(xiàn)在基建模式的變革,更體現(xiàn)在先進的智算中心設計理念上。過去十年,CPU 熱設計功率(TDP)幾乎翻了一番,而GPU熱設計功耗已從2008年的不足200W到目前的1000W,單機柜功率密度已從5kW攀升至100kW以上。在AI對算力的無止境需求驅動下,未來智算中心必然是高密化+綠色化的。Scale Up所帶來的部署密度提升是實現(xiàn)Scale Out規(guī)模持續(xù)擴張的前提和基礎,而液冷、智能溫控等先進制冷技術則會解決Scale Up引發(fā)的散熱問題,二者疊加會把占地大、能耗高的數(shù)百兆瓦的智算中心壓縮成更加緊湊、更加節(jié)能的智算中心,未來智算中心的設計建造必須要意識到這一點。
元腦算力工廠全面遵循了“高密+綠色”的未來智算中心設計理念,算力節(jié)點大量使用高密智算算力倉,將風冷機柜的負載上限提升至50kW,液冷機柜的負載上限更是高達130kW。高密智算算力倉集計算、存儲、網(wǎng)絡于一體,高效融合機柜、配電、UPS、空調、監(jiān)控、消防等系統(tǒng),基于標準化、去工程化、運行效率最優(yōu)化、管理智能化等原則設計,具有超高密度部署、綠色節(jié)能、安全可靠等特性。
而為解決高密度部署帶來的散熱和能耗問題,元腦算力工廠將液冷+光伏+儲能+余熱回收等多種綠色技術有機結合,PUE可降至1.1以下,并采用智能管理平臺實現(xiàn)IT和機房設備的控制聯(lián)動,更加綠色節(jié)能。例如,光伏發(fā)電技術能夠直接將太陽能轉換為電能,為智算中心提供清潔的電力來源;儲能技術則允許智算中心在電力需求低時儲存能量,并在高峰時段使用儲存的能量,從而平衡電網(wǎng)負荷并提高能源利用效率。同時,集成冷站采用變頻冷機,冬季和過渡季節(jié)實現(xiàn)自然冷卻,15℃/21℃中溫冷水制冷,整機能效比≥5.5,結合余熱利用技術,冬季可覆蓋辦公區(qū)供暖。此外,集裝箱為預制化鋼結構建筑,材料回收率超80%,施工現(xiàn)場無粉塵噪音,建筑垃圾少,實現(xiàn)綠色環(huán)保。
元腦算力工廠的投運,顯示出浪潮信息能夠為數(shù)據(jù)中心客戶提供包含規(guī)劃設計、大機電解決方案、集成工藝管控、施工組織設計和現(xiàn)場項目交付管理等在內的全流程端到端服務,實現(xiàn)算力基礎設施的整機柜/集裝箱交付及算力擴容的模塊化擴展,賦能千行百業(yè)數(shù)智化轉型。
目前,元腦算力工廠已成為浪潮信息智能化轉型的重要支點,承載著供應鏈大腦、智能工廠、大模型迭代開發(fā)、智能客服、智能編程助手等一系列智能化業(yè)務,進一步提升了浪潮信息的智能制造及智能管理水平。同時,浪潮信息也將AI技術廣泛應用于數(shù)據(jù)中心的日常維護、供配電系統(tǒng)管理、制冷系統(tǒng)自動化管理、設備故障預測、狀態(tài)監(jiān)控、算力智能調度等各個方面,實現(xiàn)算力工廠的高效穩(wěn)定運營。
趙帥強調說,算力工廠重新定義了算力釋放的價值與效率,與傳統(tǒng)數(shù)據(jù)中心有顯著區(qū)別。傳統(tǒng)數(shù)據(jù)中心需要先完成基礎設施的投入,才能夠部署算力,是先投入后產(chǎn)出;但是在新的智算時代下,算力工廠所采用的預制化AIDC方案實現(xiàn)了基建與算力的強綁定,是以算力為中心來確定建設模式和內部的算力模組,所有設計都是算力的一部分,實現(xiàn)了投入即產(chǎn)出。