近日,基準(zhǔn)測(cè)試平臺(tái)Chatbot Arena發(fā)布了最新的大模型盲測(cè)排名。10天前發(fā)布的阿里通義千問(wèn)開源模型Qwen2.5再次闖入全球十強(qiáng),其Qwen2.5-72B-Instruct大語(yǔ)言模型在榜單中位列第十,是前十名中唯一的中國(guó)模型。此外,通義千問(wèn)的視覺(jué)語(yǔ)言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的開源大模型。
與此同時(shí),基于Qwen系列的衍生模型在全球開源社區(qū)中的數(shù)量已突破7.43萬(wàn),超過(guò)了Llama系列的7.28萬(wàn),成為全球最大的生成式語(yǔ)言模型家族。在Hugging Face社區(qū)的開源模型排行榜Open LLM Leaderboard上,Qwen系列及其衍生模型包攬了前十全部座次。
Chatbot Arena由開放研究機(jī)構(gòu)LMSYS Org推出,是目前全球頂尖的大模型測(cè)試平臺(tái)。平臺(tái)目前集成了全球70多個(gè)大模型,采用匿名方式將大模型兩兩組隊(duì),交給用戶進(jìn)行盲測(cè),用戶根據(jù)真實(shí)對(duì)話體驗(yàn)對(duì)模型能力進(jìn)行投票。
原創(chuàng)文章,作者:潮玩君,如若轉(zhuǎn)載,請(qǐng)注明出處:http://m.rponds.cn/article/684168.html