華為云黃瑾:六大科技創(chuàng)新,昇騰云定義下一代AI基礎(chǔ)設(shè)施

“隨著大模型訓(xùn)練和推理對(duì)算力需求的爆炸式增長(zhǎng),傳統(tǒng)計(jì)算架構(gòu)已難以支撐AI技術(shù)的代際躍遷,超節(jié)點(diǎn)架構(gòu)的誕生不僅是技術(shù)的突破,更是以工程化創(chuàng)新開(kāi)辟AI產(chǎn)業(yè)的新路徑?!?月16日,華為云副總裁黃瑾在華為云AI峰會(huì)上表示。

據(jù)黃瑾介紹,華為云CloudMatrix 384超節(jié)點(diǎn)具備MoE親和、以網(wǎng)強(qiáng)算、以存強(qiáng)算、長(zhǎng)穩(wěn)可靠、朝推夜訓(xùn)、即開(kāi)即用六大領(lǐng)先技術(shù)優(yōu)勢(shì),以系統(tǒng)架構(gòu)創(chuàng)新重新定義新一代AI基礎(chǔ)設(shè)施。

圖1:黃瑾.png

六大優(yōu)勢(shì),重新定義AI基礎(chǔ)設(shè)施架構(gòu)

當(dāng)前,大模型訓(xùn)練經(jīng)歷了從早期小模型在單卡訓(xùn)練、小參數(shù)大模型在單機(jī)訓(xùn)練,到現(xiàn)在MoE、長(zhǎng)序列、多模態(tài)大模型都在AI集群上訓(xùn)練的演進(jìn)過(guò)程。AI算力的瓶頸,從單卡算力的瓶頸到單機(jī)內(nèi)總線帶寬的瓶頸,再到現(xiàn)在集群間通信帶寬的瓶頸,需求增長(zhǎng)了1萬(wàn)倍。

然而過(guò)去的8年里,單卡硬件的算力增長(zhǎng)了40倍,但是節(jié)點(diǎn)內(nèi)的總線帶寬只增長(zhǎng)了9倍,跨節(jié)點(diǎn)的網(wǎng)絡(luò)帶寬只增長(zhǎng)了4倍,這使得集群網(wǎng)絡(luò)通信成為當(dāng)前大模型訓(xùn)練和推理的最大挑戰(zhàn)。

黃瑾表示,面對(duì)這些挑戰(zhàn),華為云創(chuàng)新性的推出了采用全對(duì)等互聯(lián)架構(gòu)的CloudMatrix 384超節(jié)點(diǎn)。這項(xiàng)技術(shù)創(chuàng)新跳出單點(diǎn)技術(shù)限制走向系統(tǒng)性、工程性的創(chuàng)新算力架構(gòu),直面通信效率瓶頸、內(nèi)存墻制約、可靠性短板三大技術(shù)挑戰(zhàn)。通過(guò)新型高速互聯(lián)總線實(shí)現(xiàn)384 張卡互聯(lián)成為一個(gè)超級(jí)云服務(wù)器,最高提供300Pflops的算力規(guī)模,比業(yè)界同類產(chǎn)品領(lǐng)先67%。

目前,基于CloudMatrix的超節(jié)點(diǎn)集群已經(jīng)在蕪湖、貴安、內(nèi)蒙古規(guī)模上線,黃瑾總結(jié)了六大技術(shù)創(chuàng)新點(diǎn),即MoE親和架構(gòu),從“小作坊”到“超級(jí)工廠”;以網(wǎng)強(qiáng)算,雙層網(wǎng)絡(luò)破解“數(shù)據(jù)堵車”;以存強(qiáng)算,彈性內(nèi)存改寫“算存綁定”;長(zhǎng)穩(wěn)可靠,故障自愈的“AI醫(yī)生”;朝推夜訓(xùn),算力資源“錯(cuò)峰用電”;即開(kāi)即用,“算力水電”普惠模式。

做好智能世界云底座和使能器,加速行業(yè)智能躍遷

如今AI已經(jīng)成為最有影響力的通用技術(shù),如何將技術(shù)價(jià)值轉(zhuǎn)化為應(yīng)用成果,成為千行百業(yè)面臨的核心課題。華為云超節(jié)點(diǎn)創(chuàng)新系統(tǒng)架構(gòu)的背后,是華為云堅(jiān)持“昇騰云服務(wù)支持百模千態(tài),盤古大模型重塑千行萬(wàn)業(yè)”的戰(zhàn)略。

黃瑾強(qiáng)調(diào),一直以來(lái)華為云持續(xù)推動(dòng)昇騰AI云服務(wù)全面升級(jí),通過(guò)打磨昇騰云的訓(xùn)練、推理的性能、可靠性和性價(jià)比,為中國(guó)乃至全球客戶提供好用、易用的AI算力云服務(wù)?,F(xiàn)已全面適配了DeepSeek在內(nèi)的160多個(gè)大模型,以云服務(wù)的方式,協(xié)助客戶進(jìn)行模型的開(kāi)發(fā),訓(xùn)練,托管和應(yīng)用。昇騰AI云服務(wù)上線以來(lái),面向政府、金融、零售、互聯(lián)網(wǎng)、交通、制造等行業(yè)已經(jīng)服務(wù)六百多家創(chuàng)新先鋒企業(yè),加速行業(yè)智能化應(yīng)用的快速落地。

在充滿突破和創(chuàng)新的AI發(fā)展過(guò)程中,每一個(gè)階段都會(huì)產(chǎn)生大量的新技術(shù)、新模式,企業(yè)唯有抓住AI時(shí)代機(jī)遇,才能搶占發(fā)展先機(jī)。黃瑾表示,面向智能世界,華為云致力于做好行業(yè)數(shù)字化的“云底座”和“使能器”,堅(jiān)定打造AI算力底座,以安全、穩(wěn)定、高質(zhì)量、持續(xù)創(chuàng)新的AI云服務(wù),賦能千行萬(wàn)業(yè)應(yīng)用創(chuàng)新,攜手伙伴、客戶加速行業(yè)智能躍遷。

編輯:孫冰

頂部