阿里通義開源模型Qwen2.5進(jìn)入大模型盲測(cè)全球前十

基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena發(fā)布了最新的大模型盲測(cè)排名。10天前發(fā)布的阿里通義千問(wèn)開源模型Qwen2.5再次闖入全球十強(qiáng),其Qwen2.5-72B-Instruct大語(yǔ)言模型在榜單中位列第十,是前十名中唯一的中國(guó)模型。此外,通義千問(wèn)的視覺(jué)語(yǔ)言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的開源大模型。

近日,基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena發(fā)布了最新的大模型盲測(cè)排名。10天前發(fā)布的阿里通義千問(wèn)開源模型Qwen2.5再次闖入全球十強(qiáng),其Qwen2.5-72B-Instruct大語(yǔ)言模型在榜單中位列第十,是前十名中唯一的中國(guó)模型。此外,通義千問(wèn)的視覺(jué)語(yǔ)言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的開源大模型。

阿里通義開源模型Qwen2.5進(jìn)入大模型盲測(cè)全球前十

與此同時(shí),基于Qwen系列的衍生模型在全球開源社區(qū)中的數(shù)量已突破7.43萬(wàn),超過(guò)了Llama系列的7.28萬(wàn),成為全球最大的生成式語(yǔ)言模型家族。在Hugging Face社區(qū)的開源模型排行榜Open LLM Leaderboard上,Qwen系列及其衍生模型包攬了前十全部座次。

Chatbot Arena由開放研究機(jī)構(gòu)LMSYS Org推出,是目前全球頂尖的大模型測(cè)試平臺(tái)。平臺(tái)目前集成了全球70多個(gè)大模型,采用匿名方式將大模型兩兩組隊(duì),交給用戶進(jìn)行盲測(cè),用戶根據(jù)真實(shí)對(duì)話體驗(yàn)對(duì)模型能力進(jìn)行投票。

原創(chuàng)文章,作者:潮玩君,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.rponds.cn/article/684168.html

潮玩君的頭像潮玩君管理團(tuán)隊(duì)

相關(guān)推薦

  • 超越GPT-4 Claude 3超大杯成新王

    Claude 3 Opus在Chatbot Arena的聊天機(jī)器人對(duì)戰(zhàn)排行榜中反超GPT-4,成為新冠軍,且Claude 3家族整體表現(xiàn)亮眼。Chatbot Arena榜單權(quán)威,基于真實(shí)人類用戶體驗(yàn)打分。Claude 3因其勤奮和低成本受到好評(píng),尤其Claude 3 Haiku能以低成本即時(shí)運(yùn)行并提供高智能客戶服務(wù)。相比之下,ChatGPT被指在過(guò)去一年中零增長(zhǎng),面臨競(jìng)爭(zhēng)壓力,垂直化AI初創(chuàng)公司正滿足用戶需求。ChatGPT未來(lái)可能以平臺(tái)專屬模型為特色,成為新的增長(zhǎng)點(diǎn)。

    2024年3月28日

發(fā)表回復(fù)

登錄后才能評(píng)論