date
category
tag
summary
刚发布的 Gemini 1.5 Pro 的实验版本,供您在 Google AI Studio 和 Gemini API 中进行早期测试和反馈。体验链接 👉 https://aistudio.google.com
来源:
以下是来自Chatbot Arena (聊天机器人竞技场)的好消息!
过去一周,@GoogleDeepMind 的新版 Gemini 1.5 Pro(实验版 0801)在竞技场进行了测试,获得了超过 1.2 万张社区选票。谷歌 Gemini 以 1300 分的骄人成绩超越 GPT-4o/Claude-3.5,首次荣登榜首,并在我们的 "愿景排行榜" 上名列第一。
Gemini 1.5 Pro (0801) 在多语言任务中表现出色,在数学、硬提示和编码等技术领域表现强劲。热烈祝贺 @GoogleDeepMind 取得这一非凡的里程碑!
Gemini (0801) 类别排名:
- 总排名 #1
- 数学 #1-3
- 遵循指令:#1-2
- 编码 #3-5
- 硬提示(英语): #2-5
更多分析如下👇
Gemini 1.5 Pro(实验版 0801)在 Vision Leaderboard 上排名第一。
Gemini 显示出强大的多语言能力: #在中文、日文、德文、俄文中均排名第一。
但在编码/硬提示等技术领域的竞技中,Claude 3.5 Sonnet、GPT-4o、Llama 405B 仍遥遥领先。
总胜率热图: Gemini 1.5 Pro (0801) 对 GPT-4o 的胜率为 54%,对 Claude-3.5-Sonnet 的胜率为 59%。 请访问 https://chat.lmsys.org/?leaderboard 查看完整数据,并与模型交流!