?小米大模型團隊音頻推理登頂MMAU榜

XIAOMI ? 1天前 ? AI

近日，小米大模型團隊在音頻推理領域取得重大突破，成功登頂國際權威的MMAU（Masive Multi-Task Audio Understanding and Reasoning）音頻理解評測榜首。這一成就得益于團隊將強化學習算法應用于多模態(tài)音頻理解任務，僅用一周時間便實現了64.5%的SOTA（State Of The Art）準確率。

據悉，MMAU評測集通過一萬條涵蓋語音、環(huán)境聲和音樂的音頻樣本，測試模型在27種技能上的表現，期望模型達到接近人類專家的邏輯分析水平。此前，表現最好的模型來自OpenAI的GPT-4o，準確率為57.3%。小米團隊受DeepSeek-R1啟發(fā)，將GRPO算法遷移到Qwen2-Audio-7B模型上，在僅使用3.8萬條訓練樣本的情況下，實現了顯著的性能提升。

此次實驗不僅驗證了強化學習在音頻推理領域的獨特價值，也為后續(xù)研究提供了新的思路。小米團隊表示，將把訓練代碼、模型參數開源，并提供技術報告，供學術界和產業(yè)界參考交流。這一成果標志著小米在人工智能領域的技術實力不斷提升，也為智能聽覺時代的發(fā)展注入了新的活力。

原創(chuàng)文章，作者：XIAOMI，如若轉載，請注明出處：http://m.rponds.cn/article/710539.html

XIAOMI認證作者

0 0

AI

快手可靈AI宣布全面接入DeepSeek-R1，一句話就能生成專業(yè)級視頻

快手旗下AI創(chuàng)意平臺可靈AI宣布全面接入深度求索（DeepSeek）公司的大模型DeepSeek-R1，進一步優(yōu)化視頻、圖片生成的智能提示詞功能。用戶通過輸入簡單靈感描述，即可由A…

AI
9小時前
AI

OpenAI向美政府緊急提交指控信，”狙擊”中國AI新貴

美國當地時間3月15日，人工智能領域領軍企業(yè)OpenAI向美國政府提交正式信函，矛頭直指中國AI公司深度求索（DeepSeek）。這份長達15頁的文件引發(fā)業(yè)界震動，揭示出全球人工智…

AI
1天前
新聞

OpenAI要求美國政府放開版權限制訓練AI

美國AI巨頭OpenAI于昨日向聯(lián)邦政府提交一份?“版權戰(zhàn)略”建議書?，公開呼吁放寬對AI公司使用受版權保護材料的法律限制，稱當前監(jiān)管“扼殺創(chuàng)新”。此舉立即引發(fā)全球藝術家、記者等創(chuàng)…

檸萌
4天前
手機

Redmi Turbo 4 Pro要來了！驍龍8s Elite+超大電池

知名數碼博主@數碼閑聊站爆料稱，某廠商搭載高通驍龍8s Elite（型號SM8735）的新機將于4月發(fā)布。根據評論區(qū)網友推測，該機型或為Redmi Turbo 4 Pro，主打高性…

XIAOMI
6天前
AI

OpenAI推出新工具：AI助理進化到“替你干活”時代

近日，OpenAI正式推出三項開發(fā)者工具——Responses API、Agents SDK及計算機使用工具，推動AI智能體從“聊天對話”向“任務執(zhí)行”跨越升級，該技術方案將于20…

AI
6天前
AI

小米緊急辟謠“鐵大”量產傳聞：人形機器人CyberOne仍處研發(fā)階段

近日，網傳小米首款全尺寸人形機器人CyberOne（藝名“鐵大”）已啟動量產籌備，稱其正分階段落地北京亦莊產線，計劃3-4月公示量產進展、4-5月開放產線參觀，并于下半年啟動大規(guī)?！?/p>

XIAOMI
2025年3月11日
AI

亞馬遜云科技首發(fā)DeepSeek-R1全托管服務，企業(yè)AI部署門檻歸零

今日，亞馬遜云科技宣布在Amazon Bedrock平臺上線完全托管的DeepSeek-R1大語言模型，成為全球首個將該模型以全托管、無服務器模式落地的云服務商。此次升級使企業(yè)無需…

AI
2025年3月11日
智車

首批小米SU7 Ultra車標被摳雷軍喊話：為這點金子違法不值當?

2025年3月9日，一輛黃色小米SU7 Ultra現身街頭引發(fā)圍觀，但車主發(fā)現小米SU7 Ultra車標已遭人摳除。現場照片顯示，車前蓋原車標位置僅剩裸露的碳纖維面板，相關討論迅速…

XIAOMI
2025年3月11日
智車

網傳小米SU7 Ultra車主深夜城區(qū)飆車？小米客服回應

小米SU7 Ultra車主違法街頭飆車事件引發(fā)熱議，小米官方回應稱新車強制新手模式，最高時速限制140km/h。系統(tǒng)更新后，車輛最高車速限制為140km/h，最大動力性能被限制。小米將對車輛設置地理圍欄，并在非賽道情況下對車輛進行限速處理。

若安丶
2025年3月10日
AI

OpenAI將與甲骨文聯(lián)手打造數據中心部署6.4萬塊英偉達GB200

軟銀、OpenAI、甲骨文等公司宣布啟動星際之門項目，計劃在美國打造新的AI基礎設施。目前，星際之門項目已開始建設，將在阿比林的得克薩斯州小城部署6.4萬塊英偉達的GB200。該數據中心將為AI應用提供強大算力資源，推動當地經濟發(fā)展。

潮玩君
2025年3月9日
商業(yè)

雷軍退出小米旗下企業(yè)合伙人行列小米科技接任合伙人

資料顯示，2025年3月，小米集團創(chuàng)始人雷軍退出其關聯(lián)企業(yè)天津拾米企業(yè)管理合伙企業(yè)（有限合伙）合伙人行列，該企業(yè)新增小米科技有限責任公司為合伙人。工商信息顯示，天津拾米成立于201…

XIAOMI
2025年3月8日
智車

雷軍：小米SU7 Ultra 90%以上車主是傳統(tǒng)豪車轉過來的 56E占一半多

小米SU7 Ultra作為小米首款豪車，搭載先進的智能科技，性能媲美保時捷、科技緊追特斯拉、豪華媲美BBA，目標是打造新豪車。小米SU7 Ultra的問世，標志著豪華車的大門對小米打開了，國產品牌全面崛起的時代開始了。

科技探索者
2025年3月7日
AI

OpenAI推出“博士級” AI智能體：每月2萬美元

今日，OpenAI宣布將推出最高月費2萬美元（約14.5萬元人民幣）的“博士級”AI智能體服務，瞄準學術研究與軟件開發(fā)領域的高端需求。此次發(fā)布的AI智能體分為三檔：基礎版（200…

AI
2025年3月6日
AI

阿里發(fā)布開源模型QwQ-32B，消費級顯卡實現滿血版性能

3月6日上午消息，阿里巴巴官宣發(fā)布并開源全新的推理模型通義千問QwQ-32B。通過大規(guī)模強化學習，千問QwQ-32B在數學、代碼及通用能力上實現質的飛躍，整體性能比肩DeepSeek-R1。

科技探索者
2025年3月6日
AI

OpenAI宣布GPT-4.5正式開放，價格是舊版30倍

今日，OpenAI宣布，即日起向所有ChatGPT Plus用戶開放GPT-4.5模型，比原計劃提前兩周落地。此次升級被官方稱為“最接近人類思維的AI系統(tǒng)”，其輸入成本高達GPT-…

AI
2025年3月6日
智車

小米SU7 Ultra全國首撞惹爭議，官方承諾售后無憂

3月5日下午，小米SU7 Ultra全國首撞惹爭議。據社交平臺流傳的現場畫面顯示，該車在某地下車庫發(fā)生剮蹭事故，左前翼子板明顯開裂，大燈燈罩出現裂痕。這是自3月2日首批交付以來，該…

XIAOMI
2025年3月6日
AI

OpenAI啟動5000萬美元輔助計劃：資助15所大學進行學術研究

OpenAI成立NextGenAI聯(lián)盟，提供5000萬美元研究資助、計算資源和API訪問權限，為頂尖大學人工智能輔助研究提供支持。此舉對美國人工智能研究資助面臨不確定性之際，有助于推動人工智能發(fā)展。

潮玩君
2025年3月5日
AI

OpenAI會員專享！GPT-4.5高級模型本周上線

今日，OpenAI創(chuàng)始人兼CEO薩姆·奧爾特曼通過社交平臺宣布，新一代語言模型GPT-4.5將于未來幾天內向ChatGPT高級訂閱用戶開放。該服務將優(yōu)先覆蓋每月支付20美元（約合1…

AI
2025年3月5日
商業(yè)

OpenAI勁敵Anthropic完成35億美E輪融資，估值飆至615億美元

據外媒報道，被視為OpenAI最強競爭對手的?Anthropic?宣布完成?35億美元（約255.11億元人民幣）E輪融資?，投后估值攀升至?615億美元（約4482.57億元人民…

商業(yè)頭條
2025年3月4日
出海

?小米雙箭齊發(fā)！家電+汽車全球戰(zhàn)略首度曝光

當地時間3月3日，西班牙巴塞羅那世界移動通信大會（MWC 2025）上，小米集團合伙人、總裁盧偉冰宣布?小米15系列全球上市?，并首次披露“家電出海+汽車全球化”戰(zhàn)略，計劃未來三年…

XIAOMI
2025年3月4日

發(fā)表回復

登錄后才能評論

?小米大模型團隊音頻推理登頂MMAU榜

相關推薦

發(fā)表回復

分享到: