英偉達發(fā)布80億參數(shù)新AI模型：精度、效率高，可在RTX工作站上部署

科技探索者 ? 2024年8月23日 13:21:00 ? AI

英偉達攜手 Mistral AI 上月發(fā)布開源 Mistral NeMo 12B 模型，在此基礎(chǔ)上英偉達再次推出更小的 Mistral-NeMo-Minitron 8B 模型，共 80 億個參數(shù)，可以在搭載英偉達 RTX 顯卡的工作站上運行。

8 月 23 日消息，英偉達于 8 月 21 日發(fā)布博文，發(fā)布了 Mistral-NeMo-Minitron 8B 小語言 AI 模型，具備精度高、計算效率高等優(yōu)點，可在 GPU 加速的數(shù)據(jù)中心、云和工作站上運行模型。

英偉達表示通過寬度剪枝（width-pruning）Mistral NeMo 12B，并知識蒸餾（knowledge distillation）輕度重新訓(xùn)練后獲得 Mistral-NeMo-Minitron 8B，相關(guān)成果發(fā)表在《Compact Language Models via Pruning and Knowledge Distillation》論文中。

剪枝通過去除對準(zhǔn)確率貢獻最小的模型權(quán)重來縮小神經(jīng)網(wǎng)絡(luò)。在 “蒸餾” 過程中，研究小組在一個小型數(shù)據(jù)集上重新訓(xùn)練剪枝后的模型，以顯著提高通過剪枝過程而降低的準(zhǔn)確率。

就其規(guī)模而言，Mistral-NeMo-Minitron 8B 在語言模型的九項流行基準(zhǔn)測試中遙遙領(lǐng)先。這些基準(zhǔn)涵蓋了各種任務(wù)，包括語言理解、常識推理、數(shù)學(xué)推理、總結(jié)、編碼和生成真實答案的能力。附上相關(guān)測試結(jié)果如下：

英偉達發(fā)布80億參數(shù)新AI模型：精度、效率高，可在RTX工作站上部署

參考

Lightweight Champ: NVIDIA Releases Small Language Model With State-of-the-Art Accuracy

Mistral-NeMo-Minitron 8B Foundation Model Delivers Unparalleled Accuracy

Compact Language Models via Pruning and Knowledge Distillation

原創(chuàng)文章，作者：科技探索者，如若轉(zhuǎn)載，請注明出處：http://m.rponds.cn/article/675651.html

科技探索者管理團隊

0 0

新聞

英偉達2025-2026年度博士獎學(xué)金揭曉：6位華人學(xué)者獲獎

今日，英偉達公司公布了其2025-2026年度博士獎學(xué)金名單，共有10位博士研究生獲此殊榮，其中包括6位華人學(xué)者。此次獎學(xué)金金額較往年上漲20%，每位獲獎?wù)邔@得6萬美元的資助。 …

小科同學(xué)
2天前
新聞

英偉達回應(yīng)Nvidia App致部分游戲性能下降：正全力修復(fù)

當(dāng)?shù)貢r間周一，Tom’s Hardware對最新的“英偉達應(yīng)用程序”（Nvidia App）展開測試，結(jié)果發(fā)現(xiàn)該應(yīng)用會致使某些游戲性能降低最高達 15%。對此，英偉達官…

野游栗
4天前
商業(yè)

英偉達股價持續(xù)下滑，投資者擔(dān)憂AI支出前景

近日，英偉達股價持續(xù)呈現(xiàn)下跌趨勢，周二再跌1.2%，引發(fā)了市場的廣泛關(guān)注。這家全球領(lǐng)先的人工智能芯片制造商的股價，已從11月初的歷史高峰148.88美元下跌了約12%。據(jù)了解，投…

商業(yè)頭條
4天前
新聞

英偉達中國否認(rèn)“斷供”：將持續(xù)為中國客戶提供服務(wù)

近日，NVIDIA技術(shù)服務(wù)（北京）有限公司通過其官方微博@NVIDIA英偉達中國發(fā)布聲明，針對“NVIDIA對中國市場斷供”的傳聞，英偉達中國否認(rèn)“斷供”，明確表示該消息為不實傳聞…

NEWS
2024年12月13日
新聞

美法院拒絕英偉達投資者訴訟案上訴請求，案件將繼續(xù)審理

近日，美國最高法院拒絕了英偉達關(guān)于一項投資者集體訴訟的上訴請求。據(jù)了解，該訴訟由投資者發(fā)起，指控英偉達在加密貨幣市場對其銷售額影響的問題上誤導(dǎo)了股東。信息顯示，該訴訟起源于201…

李森
2024年12月12日
新聞

Counterpoint：2024年Q3全球半導(dǎo)體市場回暖，AI和內(nèi)存需求強勁

近日，市場調(diào)查機構(gòu)Counterpoint Research發(fā)布報告稱，2024年第三季度全球半導(dǎo)體市場呈現(xiàn)回暖趨勢，主要得益于人工智能（AI）技術(shù)需求和內(nèi)存市場的復(fù)蘇。報告顯示…

李小白
2024年12月11日
新聞

英偉達回應(yīng)反壟斷立案調(diào)查：愿配合監(jiān)管機構(gòu)

近日，據(jù)國家市場監(jiān)督管理總局通報，全球知名圖形處理器制造商英偉達公司因涉嫌違反《中華人民共和國反壟斷法》及相關(guān)審查決定，已被該局依法立案調(diào)查。對此，英偉達回應(yīng)反壟斷立案調(diào)查表示：愿…

NEWS
2024年12月10日
商業(yè)

英偉達市值一夜蒸發(fā)6400億元，AI芯片巨頭遭遇市場“滑鐵盧”

美東時間周一，全球科技巨頭英偉達遭遇了一場前所未有的市值危機。據(jù)最新數(shù)據(jù)顯示，芯片龍頭英偉達收跌2.55%，報收138.810美元，英偉達市值一夜蒸發(fā)6400億元。作為AI芯片領(lǐng)…

商業(yè)頭條
2024年12月10日
新聞

涉嫌違反反壟斷法英偉達被立案調(diào)查

近日，有消息稱，因涉嫌違反反壟斷法，英偉達被立案調(diào)查。報道稱，英偉達公司因涉嫌違反《中華人民共和國反壟斷法》及相關(guān)法規(guī)，被中國國家市場監(jiān)管總局依法立案調(diào)查。此次調(diào)查的原因是英偉達…

小丸子
2024年12月10日
新聞

英偉達CEO黃仁勛被曝涉嫌利用美國遺產(chǎn)稅收漏洞避稅80億美元

近日，有媒體報道，英偉達CEO黃仁勛被曝利用美國聯(lián)邦遺產(chǎn)稅和贈與稅中的法律漏洞，成功規(guī)避高達80億美元的潛在稅款。據(jù)報道，黃仁勛的凈資產(chǎn)目前高達1270億美元，是美國第十大富豪?！?/p>

科技探索者
2024年12月9日
出海

英偉達宣布收購越南VinBrain，拓展醫(yī)療AI領(lǐng)域

昨日，英偉達公司CEO黃仁勛宣布，英偉達將收購越南Vingroup旗下的人工智能公司VinBrain。黃仁勛表示，此次收購是英偉達“未來主要設(shè)計中心的起點”，標(biāo)志著英偉達在人工智能…

NEWS
2024年12月6日
新聞

傳聞xAI已訂購價值10.8億美元英偉達GB200 AI服務(wù)器，將于2025年1月交付

據(jù)外媒最新報道，馬斯克旗下的xAI公司已經(jīng)訂購了價值10.8億美元的英偉達GB200 AI服務(wù)器。這些服務(wù)器預(yù)計將于2025年1月獲得交付。據(jù)了解，這批GB200 AI服務(wù)器已經(jīng)…

NEWS
2024年12月5日
商業(yè)

英偉達財報發(fā)布：營收351億美元創(chuàng)歷史新高，數(shù)據(jù)中心業(yè)務(wù)強勁增長

今日，英偉達公司公布了其截至2024年10月27日的2025財年第三季度的財務(wù)報告。本季度，英偉達以驚人的表現(xiàn)再次刷新了營收紀(jì)錄，總營收達到351億美元（當(dāng)前約2540.77億元人…

商業(yè)頭條
2024年11月21日
新聞

英偉達與谷歌Quantum AI合作加速量子計算機開發(fā)

近日，英偉達與谷歌Quantum AI宣布達成一項重要合作，旨在利用英偉達CUDA-Q平臺助力谷歌研究人員開發(fā)量子計算機的海量數(shù)字模型，共同解決量子計算處理器設(shè)計中的復(fù)雜難題。根…

NEWS
2024年11月19日
產(chǎn)品

英偉達Blackwell處理器災(zāi)情：因過熱問題致項目延期

當(dāng)?shù)貢r間周日，有外媒報道了關(guān)于英偉達Blackwell處理器災(zāi)情的消息。英偉達新一代Blackwell處理器在高容量服務(wù)器機架中遭遇了嚴(yán)重的過熱問題。這一技術(shù)難題不僅導(dǎo)致了設(shè)計上的…

AI
2024年11月18日
新聞

英偉達、軟銀深化AI合作，后者將接收全球首個正式版DGX B200系統(tǒng)

英偉達AISummitJapan2024上，英偉達與軟銀合作，軟銀將獲全球首個DGXB200系統(tǒng)建日本最強AI超算，并開發(fā)AI-RAN網(wǎng)絡(luò)提高電信容量利用率。雙方預(yù)計AI-RAN投資回報率高，推動日本AI產(chǎn)業(yè)革命。

科技探索者
2024年11月14日
新聞

英偉達對云游戲GeForce Now服務(wù)進行收費調(diào)整

英偉達2025年1月1日起對GeForceNow會員設(shè)每月100小時游戲時間限，避免未來提價，影響6%會員。未用時間累積，超限需購額外時間或用基礎(chǔ)配。11月22日前享25%折扣。

蘋果派
2024年11月8日
商業(yè)

馬斯克旗下xAI計劃融資50億美元，估值或達450億美元

據(jù)知情人士透露，埃隆·馬斯克旗下的AI初創(chuàng)公司xAI正計劃以驚人的450億美元（當(dāng)前約3200.68億元人民幣）估值籌集50億美元資金。這一輪融資吸引了眾多頂級風(fēng)投公司的關(guān)注，包括…

商業(yè)頭條
2024年11月5日
AI

消息稱英偉達有意參與馬斯克旗下xAI數(shù)十億美元融資

埃隆?馬斯克旗下 AI 初創(chuàng)公司 xAI 正打算以約 450 億美元（當(dāng)前約 3200.68 億元人民幣）的估值籌集 50 億美元資金，投資者可能包括紅杉資本、Andreessen Horowitz 和 Vy Capital 等風(fēng)投公司。

蘋果派
2024年11月5日
新聞

英偉達布局印度市場印度半導(dǎo)體產(chǎn)業(yè)“雄心”更近一步？

芯片巨頭英偉達創(chuàng)始人兼首席執(zhí)行官黃仁勛和印度信實工業(yè)（Reliance Industries）董事長穆克什·安巴尼討論了人工智能基礎(chǔ)設(shè)施投資合作前景。英偉達表示，該公司將向信實工業(yè)在印度古吉拉特邦建造的一個數(shù)據(jù)中心提供Blackwell人工智能處理器。

科技探索者
2024年10月29日

發(fā)表回復(fù)

登錄后才能評論

英偉達發(fā)布80億參數(shù)新AI模型：精度、效率高，可在RTX工作站上部署

相關(guān)推薦

發(fā)表回復(fù)