Chatbot Arena

  • 阿里通義開源模型Qwen2.5進入大模型盲測全球前十

    基準測試平臺Chatbot Arena發(fā)布了最新的大模型盲測排名。10天前發(fā)布的阿里通義千問開源模型Qwen2.5再次闖入全球十強,其Qwen2.5-72B-Instruct大語言模型在榜單中位列第十,是前十名中唯一的中國模型。此外,通義千問的視覺語言模型Qwen2-VL-72B-Instruct排名第九,是得分最高的開源大模型。

    2024年9月30日
  • 超越GPT-4 Claude 3超大杯成新王

    Claude 3 Opus在Chatbot Arena的聊天機器人對戰(zhàn)排行榜中反超GPT-4,成為新冠軍,且Claude 3家族整體表現(xiàn)亮眼。Chatbot Arena榜單權威,基于真實人類用戶體驗打分。Claude 3因其勤奮和低成本受到好評,尤其Claude 3 Haiku能以低成本即時運行并提供高智能客戶服務。相比之下,ChatGPT被指在過去一年中零增長,面臨競爭壓力,垂直化AI初創(chuàng)公司正滿足用戶需求。ChatGPT未來可能以平臺專屬模型為特色,成為新的增長點。

    2024年3月28日