DeepSeek影響力持續(xù)“破圈”,可“甜蜜的煩惱”是,官網(wǎng)總是“服務(wù)器繁忙”。
好消息是,“滿血版”DeepSeek-R1、V3正在得到越來越多第三方平臺的支持。
11日,上海AI基礎(chǔ)設(shè)施企業(yè)無問芯穹宣布獲七家國產(chǎn)芯片企業(yè)鼎力支持,正打通DeepSeek-R1、V3在壁仞科技、海光信息、華為昇騰、摩爾線程、沐曦、燧原科技、天數(shù)智芯等7個硬件平臺的多芯片適配優(yōu)化,現(xiàn)開發(fā)者已可通過無問芯穹Infini-AI異構(gòu)云平臺一鍵獲取DeepSeek系列模型與多元異構(gòu)國產(chǎn)算力服務(wù)。
自春節(jié)前夕爆火,DeepSeek已牽動國內(nèi)超30家云服務(wù)商與近20家芯片企業(yè)宣布接入。隨著無問芯穹宣布獲7家國產(chǎn)芯片企業(yè)支持,并帶著多芯片適配的DeepSeek-R1入場,DeepSeek為可控國產(chǎn)算力撬動的歷史機(jī)遇,正變得愈發(fā)清晰。
“同題作答”到底誰更強(qiáng)?
DeepSeek是絕佳的商業(yè)化試煉場,激發(fā)了大量推理算力需求。幾乎主流云廠商均已宣布提供R1模型服務(wù),但全網(wǎng)找到服務(wù)不繁忙的“滿血版”還是不容易。
以前,國產(chǎn)AI芯片都號稱支持大模型部署,奈何實(shí)際使用者并不多?,F(xiàn)在,DeepSeek相當(dāng)于給AI芯片公司出了同一道考題:你到底“來賽”嗎?
短時間內(nèi),20家國產(chǎn)AI芯片企業(yè)爭相適配或上線DeepSeek模型,以期抓住這千載難逢的增長機(jī)遇。這恰恰反映當(dāng)下AI基礎(chǔ)設(shè)施的特點(diǎn):芯片和算力資源是有,但沒被高效利用起來。
如何將大量不同架構(gòu)的國產(chǎn)芯片變得能用、好用,并在使用過程中形成硬件與算法之間的正向循環(huán)?無問芯穹的策略是做“異構(gòu)云”,即統(tǒng)籌模型和算力需求,把分散在不同地方的異構(gòu)算力整合起來,實(shí)現(xiàn)不同模型和不同硬件之間的統(tǒng)一部署和聯(lián)合優(yōu)化,提供給需要算力和模型的客戶。
去年7月,無問芯穹就在業(yè)內(nèi)首次實(shí)現(xiàn)了千卡規(guī)模的4+2種芯(天數(shù)智芯、華為昇騰、沐曦、摩爾線程與AMD、英偉達(dá))異構(gòu)混訓(xùn),集群算力利用率最高達(dá)到97.6%,其運(yùn)營算力已經(jīng)覆蓋全國超13座城市。
“當(dāng)下的生態(tài)環(huán)境,需要一個從算法、硬件到模型都深入理解的團(tuán)隊(duì),無問芯穹便具備這樣的全棧垂直優(yōu)化能力?!睙o問芯穹聯(lián)合創(chuàng)始人、CEO夏立雪表示。
加速全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)
夏立雪說,DeepSeek的突破,激發(fā)了越來越多的下游應(yīng)用創(chuàng)造力,未來行業(yè)日均tokens消耗量將達(dá)到百萬億級別,不僅將激發(fā)國產(chǎn)芯片的市場需求,也為打造全國產(chǎn)AI產(chǎn)業(yè)閉環(huán),實(shí)現(xiàn)更可控的自主算力發(fā)展創(chuàng)造了有利條件。
記者了解到,在美國,模型、系統(tǒng)、芯片三個關(guān)鍵因素已經(jīng)形成閉環(huán)生態(tài);而國內(nèi)多數(shù)大模型是通過國外芯片(如英偉達(dá))訓(xùn)練得到的,與國內(nèi)的系統(tǒng)、芯片難以形成閉環(huán)。
“DeepSeek作為開源模型,其之于AI 2.0時代,正如Android之于移動互聯(lián)網(wǎng)革命,將重構(gòu)整個產(chǎn)業(yè)生態(tài),引發(fā)鏈?zhǔn)椒磻?yīng),加快上層應(yīng)用發(fā)展和下層系統(tǒng)‘統(tǒng)一’增速,由此廣泛調(diào)動起跨越軟硬件和上下游的生態(tài),一起加大投入‘國產(chǎn)模型—國產(chǎn)芯片—國產(chǎn)系統(tǒng)’的協(xié)同優(yōu)化和垂直打通?!毕牧⒀┱f。
對此,無問芯穹提出“三步走”模式,來促進(jìn)全國產(chǎn)AI產(chǎn)業(yè)閉環(huán)的打通——基于主流芯片開展極致軟硬件協(xié)同優(yōu)化,以有限算力實(shí)現(xiàn)國產(chǎn)模型能力追趕國外模型;推動國產(chǎn)芯片開放底層生態(tài),搭建“異構(gòu)”AI系統(tǒng)解決算力缺口,實(shí)現(xiàn)模型能力趕超;構(gòu)建國產(chǎn)“同構(gòu)”系統(tǒng),支持Scaling Law持續(xù)發(fā)展,打造“國產(chǎn)模型—國產(chǎn)芯片—國產(chǎn)系統(tǒng)”的全國產(chǎn)AI產(chǎn)業(yè)閉環(huán),實(shí)現(xiàn)更可控的自主算力發(fā)展。
夏立雪表示,在劈開算力封鎖的路上,DeepSeek踏出了成功的一步,接下來的“國產(chǎn)模型+國產(chǎn)算力+國產(chǎn)云服務(wù)+國產(chǎn)應(yīng)用”全國產(chǎn)化AI之路,還要靠產(chǎn)業(yè)鏈上下游的生態(tài)伙伴合力闖出來。
軟硬協(xié)同優(yōu)化是必然路徑
DeepSeek大語言模型共發(fā)布了3個大版本,參數(shù)規(guī)模從67B擴(kuò)大到236B再到如今的671B,所用的訓(xùn)練算力并未與模型尺寸等比例地成倍增長,其核心便是利用軟硬件協(xié)同設(shè)計(jì)的思想,不斷提升系統(tǒng)開銷——即模型的訓(xùn)練成本到模型尺寸、能力的轉(zhuǎn)化率。
記者了解到,軟硬協(xié)同優(yōu)化是連接硬件和算法的橋梁,區(qū)別于各種算法層面優(yōu)化方法,和硬件本身迭代的方法,而是隨著硬件變化,讓軟件也不斷優(yōu)化,或根據(jù)軟件的迭代來定義未來的底層電路實(shí)現(xiàn),以更好地支持AI算法的運(yùn)行。
業(yè)內(nèi)人士指出,DeepSeek通過軟硬件協(xié)同降低算力成本,給國內(nèi)的啟示在于這套方法論可以打破現(xiàn)在的閉環(huán)生態(tài)瓶頸。
無問芯穹核心技術(shù)團(tuán)隊(duì)早在2018年就總結(jié)出了“深度學(xué)習(xí)算法—編譯—芯片聯(lián)合設(shè)計(jì)”路線,致力于人工智能場景下能效電路和系統(tǒng)設(shè)計(jì)方法的研究,是軟硬協(xié)同路線上的早期開拓者之一。自成立以來,依托“多元異構(gòu)、軟硬協(xié)同”的核心技術(shù)優(yōu)勢,打造了連接“M種模型”和“N種芯片”的“M×N”AI基礎(chǔ)設(shè)施新范式。
蛇年春節(jié),DeepSeek和《哪吒之魔童鬧?!穬善ァ昂隈R”,扭轉(zhuǎn)了中國企業(yè)技不如人的成見,也證明了只要實(shí)力強(qiáng),自有不分國界的人鼓掌。前兩日,本報報道了《國際權(quán)威科技商業(yè)化智庫關(guān)注DeepSeek之外中國人工智能初創(chuàng)公司 四大AI新銳三家已入駐模速空間》,其中就包括了無問芯穹。有分析認(rèn)為,DeepSeek正在讓國際意識到,除了DeepSeek之外,中國還存在若干路徑獨(dú)特的團(tuán)隊(duì),在用“力大磚飛”堆疊GPU算力儲備、比拼模型精度的巨頭競賽之外,找到未被五角大樓戰(zhàn)略家們關(guān)注到的“盲點(diǎn)(blind spot)”,跨越軟硬件,攢動上下游,走出可能出奇制勝的技術(shù)路徑。
免責(zé)聲明:本網(wǎng)轉(zhuǎn)載自其它媒體的文章,目的在于弘揚(yáng)科技創(chuàng)新精神,傳遞更多科技創(chuàng)新信息,宣傳國家科技政策,展示國家科技形象,增強(qiáng)國家科技軟實(shí)力,參與國際科技輿論競爭,提高國際科技話語權(quán),并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),在此我們謹(jǐn)向原作者和原媒體致以敬意。如果您認(rèn)為本網(wǎng)文章及圖片侵犯了您的版權(quán),請與我們聯(lián)系,我們將第一時間刪除。