Chatbot Arena

新聞

阿里通義開源模型Qwen2.5進入大模型盲測全球前十

基準測試平臺Chatbot Arena發(fā)布了最新的大模型盲測排名。10天前發(fā)布的阿里通義千問開源模型Qwen2.5再次闖入全球十強，其Qwen2.5-72B-Instruct大語言模型在榜單中位列第十，是前十名中唯一的中國模型。此外，通義千問的視覺語言模型Qwen2-VL-72B-Instruct排名第九，是得分最高的開源大模型。

潮玩君
2024年9月30日
AI

超越GPT-4 Claude 3超大杯成新王

Claude 3 Opus在Chatbot Arena的聊天機器人對戰(zhàn)排行榜中反超GPT-4，成為新冠軍，且Claude 3家族整體表現(xiàn)亮眼。Chatbot Arena榜單權威，基于真實人類用戶體驗打分。Claude 3因其勤奮和低成本受到好評，尤其Claude 3 Haiku能以低成本即時運行并提供高智能客戶服務。相比之下，ChatGPT被指在過去一年中零增長，面臨競爭壓力，垂直化AI初創(chuàng)公司正滿足用戶需求。ChatGPT未來可能以平臺專屬模型為特色，成為新的增長點。

AI
2024年3月28日