C114通信網(wǎng)  |  通信人家園

資訊
2024/12/26 10:21

超節(jié)點算力集群創(chuàng)新聯(lián)合體成立:中國移動、浪潮、阿里云等參與,打造 GPU 卡間互聯(lián)體系

IT之家  汪淼

以“創(chuàng)新驅動智啟新程”為主題的 2024 中國人工智能大會(CCAI)開幕式于本月在北京召開,超節(jié)點算力集群創(chuàng)新聯(lián)合體揭牌儀式舉行。

會上,北京市科委、中關村管委會、中國移動、浪潮集團、阿里云、清華大學、中國科學院等單位共同為“超節(jié)點算力集群創(chuàng)新聯(lián)合體”揭牌。

據(jù)中國移動介紹,隨著人工智能大模型的迅猛發(fā)展,其參數(shù)規(guī)模正向超萬億級別演進,模型的性能和泛化能力不斷提升,對高性能智算基礎設施的需求更為迫切。在此背景下,傳統(tǒng)單臺智算服務器僅能容納 8 張 GPU 芯片的算力模式正被“超節(jié)點算力集群”這一形態(tài)所取代,以適應日益增長的算力需求。

“超節(jié)點算力集群創(chuàng)新聯(lián)合體”的 GPU 卡間互聯(lián)是基于中國移動原創(chuàng)的 OISA(全向智感互聯(lián))協(xié)議所構建,OISA 旨在打造一個高效、智能、靈活且開放的 GPU 卡間互聯(lián)體系,該架構致力于支持大模型訓練、推理、高性能計算等數(shù)據(jù)密集型的 AI 應用。

為了實現(xiàn)這一目標,OISA 采用了全向連接設計,確保大規(guī)模 GPU 之間對等通信;引入智能感知設計,通過定義流量感知標簽,并結合流控和重傳機制,優(yōu)化數(shù)據(jù)傳輸效率。

在協(xié)議層面,OISA 采用精悍的報文格式、支持內(nèi)存和消息的多語義融合、多層次流控重傳以及預設集合通信加速等多個關鍵技術,實現(xiàn)高帶寬、低時延和高可靠的 GPU 通信能力。

在當前 Gen1.1 版本下,OISA 支持超節(jié)點內(nèi)任意 GPU 卡間的點對點讀寫互聯(lián)帶寬達到 896GB/s,每個 OISA-Switch 芯片支持 128 個端口、交換容量 51.2T。

從中國移動官方獲悉,中國移動未來將全面支持超節(jié)點算力集群創(chuàng)新聯(lián)合體發(fā)展,計劃聯(lián)合產(chǎn)業(yè)界優(yōu)先完成在單層 Switch 條件下基于 OISA 互聯(lián)技術的 32/64 卡超節(jié)點產(chǎn)品落地,并加速 128 卡超節(jié)點產(chǎn)品的輸出。

給作者點贊
0 VS 0
寫得不太好

  免責聲明:本文僅代表作者個人觀點,與C114通信網(wǎng)無關。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機版

      Copyright©1999-2025 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權所有 舉報電話:021-54451141