GPU兇猛:芯片換主角?

《中國經(jīng)濟周刊》 記者  孫冰 | 北京報道

數(shù)字化浪潮,席卷著全世界的每一個角落。這一切變革的背后,都與小小的芯片息息相關(guān)。從手機、計算機到飛機、汽車、家用電器,從工廠的機械臂、切割機到醫(yī)院的呼吸機、超聲儀,小到手里的公交卡大到天上的衛(wèi)星,芯片已經(jīng)無處不在。

AI時代的加速到來,尤其是大模型的崛起,帶來前所未有的算力需求,這對于芯片產(chǎn)業(yè)來說,既是挑戰(zhàn),也是機遇。

過去,芯片領(lǐng)域的主角無疑是CPU(中央處理器)。但由于GPU(圖形處理器)更能夠滿足AI時代高性能計算的需求,近年來其熱度飆升,不僅指標(biāo)性公司的股價不斷攀上新高,也有大量創(chuàng)業(yè)公司和資本在此尋找機會和追逐夢想。

GPU為何會逆襲崛起?芯片要換主角了?

005

GPU兇猛,英偉達萬億

今年年初,英偉達的股價在150美元附近,今年7月一度沖高到480美元,目前 (截至8月7日) 在450美元附近,總市值超過1.1萬億美元。這意味著,今年前7個月,英偉達的市值增長了恐怖的7600多億美元,漲幅超過210%。目前,英偉達是第一家市值超過萬億美元的芯片公司,也是全球第六大市值公司。如果從上市開始計算,其股價漲幅超過了1100倍。

今年5月25日,英偉達發(fā)布了令人咋舌的一季度財報,財報中關(guān)于二季度的營收指引,更是“亮瞎華爾街的雙眼”。于是,僅在一天內(nèi),英偉達的市值就暴漲超2000億美元。而在這個星球上,市值超過2000億美元的公司并不多。

006

GPU和CPU的河?xùn)|與河西,通過“AI時代的芯片王者”英偉達和“PC時代的芯片王者”英特爾的市值對比,可以感受得更加直觀。英特爾目前市值在1470億美元左右,英偉達是其7倍還多。而“芯片三巨頭”中的另外一家AMD,因為也吃到AI浪潮的紅利,今年來股價上漲了超過35%,目前市值在1880億美元左右,依舊是老二。

更驚人的是,目前英偉達的市盈率已經(jīng)超過了200倍,風(fēng)口浪尖上的特斯拉也不過60多倍的市盈率,微軟和Meta不到40倍,谷歌不到30倍,阿里巴巴不到25倍,騰訊只有15倍……即使是“能卡住英偉達脖子”的臺積電(英偉達芯片由臺積電生產(chǎn))也只是15倍左右。

能讓資本市場如此激動主要是英偉達符合了投資人最喜歡的兩大特征:風(fēng)口行業(yè)+統(tǒng)治地位。根據(jù)近日J(rèn)on Peddie Research(JPR)發(fā)布的全球GPU市場數(shù)據(jù)報告顯示,英偉達以84%的市場份額排名第一,排名第二的AMD為12%,第三位的英特爾為4%。

GPU不就是顯卡嗎?在英特爾時代,GPU甚至都沒有“單獨名分”,被封裝在CPU內(nèi)。從某種意義上可以說,是英偉達發(fā)明了GPU,使其單獨存在。那GPU和英偉達為何會猶如坐上了火箭一般?答案其實在OpenAI和ChatGPT身上。

隨著ChatGPT等大模型掀起AI狂潮,全世界都在為這個“人類歷史上都不多見的技術(shù)革命”而興奮不已。但為何是一個GPU公司成了最大贏家?

這是因為英偉達是AI大模型背后的“軍火商”,美國銀行的一份報告更是稱其為“AI淘金時代的賣鏟王”。因為不管你是“百模大戰(zhàn)”還是“千模群舞”,統(tǒng)統(tǒng)都要跑在英偉達的GPU上。

英偉達相關(guān)人士告訴 《中國經(jīng)濟周刊》 記者,早在2016年,英偉達就向OpenAI交付了全球第一臺DGX-1超級計算機。2022年底,OpenAI創(chuàng)建的ChatGPT在短短兩個月內(nèi)收獲億級用戶,它的火爆證明了生成式AI和加速計算所帶來的“AI的iPhone時刻”已經(jīng)到來。

據(jù)該人士介紹,英偉達發(fā)明了GPU作為并行處理器,以模擬視頻游戲和電影,使其逼真如現(xiàn)實世界。雖然GPU最初被設(shè)計用于處理3D圖形的像素,但也非常擅長處理數(shù)據(jù),這使其非常適合處理深度學(xué)習(xí)任務(wù)。

“早在10多年前,人工智能研究人員就開始使用GPU進行深度學(xué)習(xí)。2011年,研究人員發(fā)現(xiàn)12個英偉達GPU可以提供2000個CPU的深度學(xué)習(xí)性能。此外,英偉達還改進了GPU設(shè)計、系統(tǒng)架構(gòu)和軟件,并加快了訓(xùn)練速度,使GPU的性能每年提高一倍以上,比摩爾定律更快。”上述人士表示。

此外,該人士還表示,GPU還可以模擬人類智能,運行深度學(xué)習(xí)算法,并充當(dāng)感知和理解世界的計算機、機器人和自動駕駛汽車的大腦。未來,英偉達也將致力于幫助客戶利用加速計算實現(xiàn)生成式AI和大語言模型的突破性進展。

“CPU是通用處理單元,你可以理解為是一個‘大管家’,什么事都要管,CPU的全部模塊中通常有25%用作運算單元 (ALU)、有25%作為控制單元 (Control)、50%用于緩存單元 (Cache);GPU則是單一的圖形處理單元,有90%的模塊用作計算單元,控制單元和緩存單元只占10%。再則GPU的計算模式是并行處理,即可以同時做很多事;而CPU是串行處理,即處理完一件事再處理另一件。因此,面對巨大的AI算力需求,計算能力更強、計算效率更高的GPU就成為主流選擇。”資深芯片研究專家、《芯片簡史》 作者汪波告訴 《中國經(jīng)濟周刊》記者,他擁有20多年芯片領(lǐng)域的科研和教學(xué)經(jīng)驗。

中金公司研究部科技硬件行業(yè)首席分析師彭虎向 《中國經(jīng)濟周刊》 記者分析,技術(shù)上,CPU采用馮·諾依曼構(gòu)架,在并行處理大量數(shù)據(jù)的運算時效率受到限制。與傳統(tǒng)CPU相比,GPU具有多線程、高核心數(shù)、更高的存儲訪問帶寬和速度,以及浮點運算能力強等優(yōu)勢,逐步發(fā)展成為當(dāng)下AI算力芯片的主流形態(tài)。

“當(dāng)然,通用型GPU也日益面臨著高效率和高功耗之間的矛盾平衡問題,專用型AI算力芯片 (如TPU、NPU、IPU等) 逐步借助自身高算力與低功耗的特點,成為某些互聯(lián)網(wǎng)云服務(wù)商提供AI算力的芯片方案之一。”彭虎說。

如果以圖靈測試為起點,人工智能的發(fā)展史已經(jīng)超過70年,數(shù)度跌宕起伏中的退潮,大多是受限于算力,要么算力不足,要么成本太高。所以,很多人調(diào)侃ChatGPT是“大力出奇跡”,一是因為英偉達造出算力強悍的GPU,二是能堆起萬顆昂貴芯片。隨著算力的強大,AI的新浪潮也將隨之到來。

007

2023年5月29日,英偉達創(chuàng)始人CEO黃仁勛在COMPUTEX大會上公布了一批與人工智能相關(guān)的新產(chǎn)品和服務(wù)。

GPU和英偉達的AI故事還遠未到高潮?

雖然洶涌的AI浪潮給英偉達帶來了驚人的增長,但其實在此之前,英偉達已經(jīng)吃過一波史詩級的數(shù)字貨幣紅利,因為計算能力更強的GPU也是“挖礦”首選。而且GPU和英偉達的“AI故事”還遠未到高潮。

根據(jù)集邦咨詢 (TrendForce)預(yù)計,2023年全球AI芯片出貨量將增長46%。其中,英偉達GPU為AI服務(wù)器市場搭載主流,市場占有率約60%~70%。

瑞穗證券 (Mizuho Securities)發(fā)布的研究報告預(yù)計,英偉達今年的營收可能達到250億至300億美元。到2027年,其AI相關(guān)收入將達3000億美元,屆時英偉達在全球AI服務(wù)器芯片市場的市場占有率將在75%左右。

如此誘人的巨大市場,自然會面臨越來越激烈的競爭。已經(jīng)纏斗了數(shù)十年的“芯片三巨頭”,英特爾(成立于1968年)、AMD(成立于1969年)和英偉達(成立于1968年)的鏖戰(zhàn)注定要延續(xù)到AI時代。

今年6月,AMD推出了數(shù)據(jù)中心APU(加速處理器)Instinct MI300,大舉進軍AI市場。在剛剛結(jié)束的AMD二季度財報電話會上,AMD首席執(zhí)行官蘇姿豐透露,本季度AMD的AI數(shù)據(jù)中心芯片客戶數(shù)量“增長了7倍以上”,預(yù)計該業(yè)務(wù)下半年業(yè)績將有50%的增幅。

英特爾則在2019年就耗資20億美元收購了以色列AI芯片公司Habana,后續(xù)又不斷補齊AI業(yè)務(wù)的各個板塊。今年英特爾推出的第二代深度學(xué)習(xí)芯片Habana Gaudi2,就是對標(biāo)英偉達100系列,專為訓(xùn)練大語言模型而構(gòu)建。英特爾還預(yù)計到2025年,將會完成Gaudi AI芯片和GPU兩條產(chǎn)品線的整合,并推出更完整、更具競爭力的下一代GPU產(chǎn)品。

搞AI芯片,也成為全球主要科技公司的必選項,畢竟誰都不想自己的算力命脈攥在英偉達手里。雖然僅僅為了ChatGPT,微軟就買下了上萬顆英偉達芯片;呼吁暫停AI研發(fā)的馬斯克也悄悄囤了1萬張英偉達A100;微軟、谷歌、Meta、特斯拉也都悉數(shù)下場,自研AI芯片。

汪波認(rèn)為,在全球GPU市場上,目前英偉達確實可以說是一家獨大。而且英偉達的護城河,不僅僅是芯片本身,還包括自己開發(fā)系統(tǒng),即CUDA計算平臺以及軟硬件生態(tài)。“這有點類似蘋果除了在iPhone等硬件上有優(yōu)勢,還有強大的iOS軟件生態(tài)系統(tǒng)。”他說。

英偉達創(chuàng)始人、CEO黃仁勛曾在今年5月對外透露,CUDA在全球已經(jīng)擁有超過400萬開發(fā)者和超過3000個應(yīng)用程序。CUDA下載量累計達到4000萬次,僅去年一年就有2500萬次。全球有40000家大型企業(yè)正在使用英偉達的產(chǎn)品進行加速計算,已有15000家初創(chuàng)公司建立在英偉達的平臺上。

當(dāng)一個你以為的硬件公司說自己是一家軟件公司的時候,是要琢磨琢磨的。就像2007年第一代iPhone發(fā)布時,有人提問喬布斯:蘋果如何避免iPhone被模仿并陷入價格競爭?喬布斯的回答是;“我們是一家軟件公司。”

“如果其他公司推出新的GPU芯片,開發(fā)者就需要學(xué)習(xí)新的開發(fā)語言,這是很痛苦的,就像要改變一個人的語言乃至思維方式。因此,與硬件匹配的軟件生態(tài)是頭部芯片公司非常重要的競爭壁壘。”汪波表示。

黃仁勛提出過一個著名的“黃氏定律”,即GPU芯片每6個月性能就會提升1倍,速度是摩爾定律的3倍。這意味著GPU是一個需要狂奔的賽道,生死時速,贏者通吃,注定屬于敢于冒險的大玩家,很容易變成塵埃,也很容易偉大。

當(dāng)然,英偉達也并非能夠躺贏??v觀芯片發(fā)展史,一家名不見經(jīng)傳的小公司,因為一個天才的芯片設(shè)計方案而迅速崛起已經(jīng)發(fā)生過很多次,這其實也是英偉達曾經(jīng)的“劇本”。

008

AI成就GPU,但GPU還不是AI的完美答案?

實際上,GPU并不是為AI所生的,它只是解決AI算力需求的一種方案,有沒有更好的?答案是肯定的,只是還不知道究竟誰是顛覆GPU的下一個芯片主角。

一位國產(chǎn)GPU廠商的GPU產(chǎn)品設(shè)計負(fù)責(zé)人告訴《中國經(jīng)濟周刊》 ,芯片是算力的基本構(gòu)成,核心的計算都運行在芯片上。整個硬件的邏輯是芯片以板卡或者其他算力卡的形態(tài),部署在服務(wù)器中,服務(wù)器安置在機柜中,大量機柜組成數(shù)據(jù)中心。大模型的崛起,毫無疑問給芯片產(chǎn)業(yè)帶來了一個巨大的潛在市場,也帶來了很多技術(shù)要求,特別是對于芯片的單卡算力性能、互連能力等關(guān)鍵性能指標(biāo)都提出更高的要求,因此需要市場開發(fā)更強的芯片產(chǎn)品。

這位負(fù)責(zé)人認(rèn)為,GPU成為主流是因為AI發(fā)展的初期,能夠獲取的最適合的芯片架構(gòu)就是GPU,因此有先發(fā)優(yōu)勢。但GPU的核心痛點在于芯片制造技術(shù)追不上算力需求的增加,也就是常說的摩爾定律走到了盡頭。目前GPU芯片所用的最先進制程是4nm~5nm制程,已經(jīng)非常逼近摩爾定律的物理極限了,未來幾乎無法再通過制程的升級來提升芯片性能。

此外,該負(fù)責(zé)人表示,傳統(tǒng)的GPU還保留了不少不需要的圖形運算功能,使得整個芯片的計算效率并不是最高,這也是GPU的劣勢。其他主流的AI芯片解決方案,也都還不完美,比如針對AI運算開發(fā)的專用芯片(ASIC)方案,雖然計算效率更高,但通用性較差。

“未來最有希望實現(xiàn)突破的還在于更新的封裝技術(shù) (比如3D封裝)、更新的材料等方式,嘗試突破摩爾定律。”該負(fù)責(zé)人說。

汪波從芯片架構(gòu)原理的角度,做了進一步的解釋。他表示,受制于其架構(gòu)本身,用GPU解決AI算力并不完美,畢竟GPU最初并不是因AI而生的。此外,GPU的計算和存儲是分開的,需要在計算和存儲之間來來回回地調(diào)用數(shù)據(jù),這種搬運數(shù)據(jù)消耗的能量是計算的10倍。而且GPU很多時候是在等待數(shù)據(jù)過來再進行計算,因此,GPU的計算效率并不高,而且功耗非常大,GPU的強大算力是要付出巨大成本的。

“在芯片設(shè)計中,一直在尋求PPA折中,即性能(Performance)、功耗(Power) 和面積 (Area)的平衡點,因為三者不能同時達到最優(yōu)。性能和功耗一直是一對矛盾,而面積越大,芯片成本越高。”汪波說。

汪波還表示,實際上,學(xué)術(shù)界和科技公司的研究者們都在研究更適配人工智能的芯片,采用新的原理和新的材料。比如做存算一體的芯片,在存儲器內(nèi)部去完成計算,不用再搬運數(shù)據(jù),這樣就能實現(xiàn)功耗更低但算力更大。“目前,雖然還在探索階段,但好消息是在這個領(lǐng)域,中國和世界同步的。”他說。

還有一個思路就是改變芯片的馮諾依曼式架構(gòu),模擬人腦數(shù)據(jù)處理方式的神經(jīng)形態(tài)芯片。“神經(jīng)形態(tài)芯片已經(jīng)發(fā)展了幾十年,雖然目前算力還沒有辦法跟GPU去PK,但如果其算力能達到GPU的一半,就可能憑借能耗和成本優(yōu)勢異軍突起。”汪波說。

彭虎也分析稱,GPU具有強大的并行計算能力和高效的浮點運算能力,且屬于通用芯片,能夠較好地滿足各類AI算法要求,但也存在較高功耗和較低算力利用率的短板。除了GPU,AI芯片還包括FPGA和各類ASIC方案。FPGA屬于具備可編程硬件結(jié)構(gòu)的集成電路,其可編程性和靈活性可快速適應(yīng)不同AI算法要求,但也存在高功耗的問題。ASIC屬于專用芯片,通過算法固化實現(xiàn)更高的算法利用率和能耗比,但開發(fā)周期較長、靈活性較弱。

“我們認(rèn)為,目前GPU仍是較好滿足AI大模型、支持多模態(tài)的成熟的一站式解決方案,ASIC以其高性價比、高能耗比等優(yōu)勢將在未來AI市場中占據(jù)一席之地。”彭虎說。

實際上,能耗問題已經(jīng)是算力發(fā)展乃至AI發(fā)展的重要瓶頸。北京智源人工智能研究院副院長兼總工程師林詠華告訴《中國經(jīng)濟周刊》 記者,一個百億級別大模型僅僅訓(xùn)練消耗的電費每天都要在10萬元以上。

“超過千億級別的大模型,訓(xùn)練需要1000~2000張A100的卡,硬件成本約5000萬美金,還需要投入人力、電力、網(wǎng)絡(luò)支出等,一年至少5000萬美金到1億美金成本。”昆侖萬維CEO方漢曾表示。

一家國內(nèi)頭部AI算力供應(yīng)商的負(fù)責(zé)人告訴 《中國經(jīng)濟周刊》 記者,一個傳統(tǒng)數(shù)據(jù)中心,電費要占運維總成本60%~70%。而每耗費一度電,卻只有一半用在了正事 (計算)上,其他則浪費在散熱上。因此,新型數(shù)據(jù)中心一般會采用液冷技術(shù),這樣可以比采用風(fēng)冷節(jié)省30%以上的電費。

全球大型互聯(lián)網(wǎng)公司都在想盡各種辦法解決散熱難題,為了降低能耗,他們把數(shù)據(jù)中心埋在山里(騰訊)、泡在湖里 (阿里)、扔進大海(微軟)、拉到北極(Meta)……

芯片封鎖加劇,中國“AI芯”怎么樣?

2018年的中興事件和2019年的華為事件之后,“芯片”不僅成為一個國民熱詞,也有大量的資本和創(chuàng)業(yè)公司進入芯片領(lǐng)域。但那時,AI芯片的方向還比較多,除了GPU,還有FPGA(現(xiàn)場可編程門陣列)和ASIC(專用集成電路)。但在英偉達的市場示范效應(yīng)之下,在2020年掀起的第二波芯片創(chuàng)業(yè)熱潮,則主要集中在GPU領(lǐng)域,尤其是GPGPU(通用圖形處理器,可通過編程進行不同計算任務(wù))。

2022年8月,美國政府禁止英偉達向中國出口最先進的高算力GPU A100和H100,英偉達隨后專門面向中國市場推出了符合美國出口管制要求的A800和H800芯片 (限制了A100和H100部分性能)。

據(jù)媒體援引消息人士稱,今年,中國的各大互聯(lián)網(wǎng)公司都在瘋狂囤貨英偉達GPU,僅僅字節(jié)跳動就向英偉達訂購了超過10億美元的GPU,這個數(shù)字已經(jīng)接近英偉達2022年在中國市場銷售的商用GPU總和,而且字節(jié)跳動還收購了市面上幾乎所有公開出售的A100芯片。

據(jù)英偉達官網(wǎng),A100芯片標(biāo)價為1萬美元/塊 (大批量采購統(tǒng)籌會有一定折扣),升級版H100 則為3.6萬美元/塊。但記者從代理商方面了解到,雖然中國版的A800和H800芯片官方售價略低,但實際上,由于供不應(yīng)求等原因,其實際價格比高性能版反而要更高,A800的溢價已經(jīng)到10萬人民幣以上。

面對巨大的市場需求和極其不確定的國外方案,中國AI企業(yè)當(dāng)然希望能有“新選擇”,也有很多中國芯片企業(yè)希望能成為“新選擇”。

“從歷史上看,一家新的芯片公司要想崛起,去挑戰(zhàn)現(xiàn)有頭部大公司,都是要先從中低端芯片開始做起,通過占領(lǐng)中低端,逐步培養(yǎng)用戶習(xí)慣和開發(fā)者規(guī)模,再慢慢向高端發(fā)展。如果直接就開發(fā)英偉達A100這樣的高端芯片,需要投入非常大的人力和資金,還要面臨軟件和生態(tài)的護城河,這是很難的。”汪波說。

汪波認(rèn)為,中國企業(yè)也可以采取類似的路徑:一是先從中低端做起,逐步邁向高端;二是先占領(lǐng)一些垂直行業(yè),先做到專門特定領(lǐng)域的引領(lǐng)地位,如醫(yī)療、工業(yè)、交通等領(lǐng)域。

“其實現(xiàn)在可以看到,中國的一些大型科技公司已經(jīng)在采用這種策略,例如華為、阿里和騰訊等都是選擇在特定領(lǐng)域發(fā)力。還有壁仞、摩爾線程、寒武紀(jì)等專門的GPU公司也都做得不錯。預(yù)計5年內(nèi),中端是可能有所突破的,但要突破高端還是需要一步步努力。”他說。

但汪波強調(diào),目前國內(nèi)GPU市場是高端芯片被限制了,但中低端芯片反而沒有限制。“很多人會認(rèn)為,中低端芯片沒限制還能用不錯,但從長遠來看,我覺得這種策略對國內(nèi)芯片公司的發(fā)展并不是一件好事,長期看會加大封鎖的破壞力。”他說。

汪波認(rèn)為,這一方面會讓國外企業(yè)大規(guī)模占領(lǐng)中國市場,給他們帶來巨額的商業(yè)回報,可以繼續(xù)維持研發(fā),做出更領(lǐng)先的產(chǎn)品;另一方面,國內(nèi)的用戶和開發(fā)者會習(xí)慣于國外系統(tǒng),這就意味著即使有國內(nèi)公司研發(fā)出性能好的芯片,也開發(fā)出軟件系統(tǒng),但會面臨切換系統(tǒng)的難題。

“這兩方面都會讓國外品牌的護城河更高。如果未來真的遭遇全面限制,在缺芯的危機之下,會加快本土芯片企業(yè)的成長,推動市場更多使用中國本土芯片。”汪波說。

在彭虎看來,目前,海外GPU公司占據(jù)全球AI芯片的主要份額,國產(chǎn)廠商正在快速追趕中。從需求來看,國內(nèi)AI行業(yè)的發(fā)展在應(yīng)用落地側(cè)具備較成熟的經(jīng)驗,帶動國內(nèi)各類AI芯片設(shè)計公司的快速興起。從供給來看,相比于海外通用GPU,國內(nèi)AI芯片設(shè)計公司普遍采用ASIC方案,較好地匹配了國內(nèi)AI市場需求。展望未來,如果國內(nèi)在芯片先進制造領(lǐng)域提升工藝水平并掌握一定產(chǎn)能,相信國內(nèi)AI芯片將獲得更大的成長發(fā)展空間。

AI算力突圍的“中國方案”

盡管難度不小,但AI芯片和AI算力都是“未來之局”,中國一定要有自己的“中國方案”。汪波表示,他對未來還是非常有信心的。“芯片設(shè)計本身主要依靠好的idea,從芯片發(fā)展史來看,創(chuàng)新往往都來自一個叛逆的想法。之前我們連3G芯片都設(shè)計不了,但在5G芯片上,我們做到了領(lǐng)先全球。”他說。

今年6月,中國科學(xué)院對外發(fā)布了“香山”開源高性能RISC-V處理器核和“傲來”RISC-V原生操作系統(tǒng)。汪波認(rèn)為,這一布局意義重大。“國外的芯片和軟件雖好,但如果不開源,高昂的價格就是最大的短板。因此,我們?nèi)绻l(fā)展開源生態(tài),就可能成為自主破局的突破口。”他說。

中國科學(xué)院計算技術(shù)研究所副所長包云崗也表示:“過去我國發(fā)展處理器芯片有兩種模式,即高鐵模式和北斗模式。前者是在現(xiàn)有生態(tài)下引進、消化、吸收、再創(chuàng)新,后者是完全自主構(gòu)建技術(shù)體系。有了RISC-V后,我們可以走第三種模式——5G模式。國內(nèi)企業(yè)應(yīng)加速參與到開放標(biāo)準(zhǔn)的制定中,同時自主研發(fā)一批關(guān)鍵核心技術(shù),面向國際市場,兼容國際生態(tài),抓住第三次芯片浪潮的時代機遇。”

當(dāng)然,中國方案已經(jīng)在加速成長。由于不能使用國外的技術(shù)架構(gòu),華為是國內(nèi)較早就開始走自研之路的企業(yè)。

“當(dāng)前中國大模型中有一半是由華為昇騰AI來支撐的。”今年7月,華為輪值董事長胡厚崑對外透露。華為昇騰計算業(yè)務(wù)總裁張迪煊也透露,截至目前,昇騰已認(rèn)證了30多家硬件伙伴、1200多家軟件伙伴,聯(lián)合孵化了2500多個AI場景方案。在中國,每2家AI企業(yè)就有1家選擇昇騰。

華為相關(guān)負(fù)責(zé)人告訴 《中國經(jīng)濟周刊》 記者,華為預(yù)測是到2030年,人類將進入YB(1億億億字節(jié))數(shù)據(jù)時代,全球通用算力將增長10倍,人工智能算力將增長500倍。

該負(fù)責(zé)人強調(diào),影響算力的因素不僅僅是芯片,需要系統(tǒng)架構(gòu)的創(chuàng)新、硬件和基礎(chǔ)軟件的協(xié)同創(chuàng)新。目前,算力需求的爆炸式增速已遠超摩爾定律,單純依靠芯片工藝進步帶來的算力提升,已不能滿足算力增長需求,必須進行計算體系的架構(gòu)創(chuàng)新,包括從通用計算走向通用計算加異構(gòu)計算的多樣性算力創(chuàng)新,以及從硬件到基礎(chǔ)軟件、到應(yīng)用使能的協(xié)同創(chuàng)新。

“萬物互聯(lián)的智能時代,非結(jié)構(gòu)化數(shù)據(jù)占比越來越大,如文本、圖片、語音、視頻等這類數(shù)據(jù)的加工、處理、傳輸,需要多樣性的計算來匹配。舉例來說,CPU處理大數(shù)據(jù)、Web等場景是非常匹配的,但是對于圖形、圖像的處理,就需要GPU來匹配;而日常生活中的圖形圖像識別、智能搜索推薦等,就可以用基于AI計算的NPU(網(wǎng)絡(luò)處理器/嵌入式神經(jīng)網(wǎng)絡(luò)處理器)來處理了。”該負(fù)責(zé)人表示。

據(jù)該負(fù)責(zé)人透露,華為是通過架構(gòu)的創(chuàng)新,提升計算的效率。“比如在計算節(jié)點層面,華為推出對等平構(gòu)架構(gòu),突破傳統(tǒng)的以CPU為中心的異構(gòu)計算帶來的性能瓶頸,使得節(jié)點性能得到30%的提升;在數(shù)據(jù)中心層面,華為發(fā)揮云、計算、存儲、網(wǎng)絡(luò)、能源的綜合優(yōu)勢,相當(dāng)于把AI數(shù)據(jù)中心當(dāng)成一臺超級計算機來設(shè)計,使得昇騰AI集群性能更高,并且更可靠。”

(本刊記者謝瑋對本文亦有貢獻)

(本文刊發(fā)于《中國經(jīng)濟周刊》2023年第15期)


2023年第15期《中國經(jīng)濟周刊》封面

2023年第15期《中國經(jīng)濟周刊》封面

頂部