
昨日,中科曙光國家先進(jìn)計(jì)算產(chǎn)業(yè)創(chuàng)新中心有限公司發(fā)布消息,海光信息技術(shù)團(tuán)隊(duì)成功完成DeepSeek V3和R1模型與海光DCU(深度計(jì)算單元)的國產(chǎn)化適配工作,且相關(guān)模型已正式上線。
這一成果意義非凡。DeepSeek V3和R1模型基于Transformer架構(gòu),采用Multi – Head Latent Attention(MLA)和DeepSeek MoE兩大核心技術(shù)。MLA能減少KV緩存,大幅降低內(nèi)存占用,提升推理效率;DeepSeek MoE則借助輔助損失實(shí)現(xiàn)專家負(fù)載的智能平衡,優(yōu)化模型性能。
對于廣大用戶而言,如今在“光合開發(fā)者社區(qū)”的“光源”板塊,或者登錄光源官網(wǎng)搜索“DeepSeek”,便可訪問、下載相關(guān)模型,并基于DCU平臺進(jìn)行部署和使用。
值得一提的是,DCU是海光信息推出的高性能GPGPU架構(gòu)AI加速卡,為行業(yè)客戶提供自主可控的全精度通用AI加速計(jì)算方案,目前已在科教、金融等多領(lǐng)域?qū)崿F(xiàn)規(guī)模化應(yīng)用。此次DeepSeek V3和R1模型與海光DCU的適配上線,有望進(jìn)一步推動相關(guān)領(lǐng)域的發(fā)展,為國產(chǎn)算力和人工智能應(yīng)用注入新動力。
原創(chuàng)文章,作者:AI,如若轉(zhuǎn)載,請注明出處:http://m.rponds.cn/article/704768.html