Gemini 1.5 Pro 综合测试成绩超越 GPT-4o
🗒️Gemini 1.5 Pro 综合测试成绩超越 GPT-4o
2024-8-2
| 2024-8-5
0  |  阅读时长 0 分钟
date
category
tag
summary
刚发布的 Gemini 1.5 Pro 的实验版本,供您在 Google AI Studio 和 Gemini API 中进行早期测试和反馈。体验链接 👉 https://aistudio.google.com
notion image
来源:
notion image
以下是来自Chatbot Arena (聊天机器人竞技场)的好消息!
过去一周,@GoogleDeepMind 的新版 Gemini 1.5 Pro(实验版 0801)在竞技场进行了测试,获得了超过 1.2 万张社区选票。谷歌 Gemini 以 1300 分的骄人成绩超越 GPT-4o/Claude-3.5,首次荣登榜首,并在我们的 "愿景排行榜" 上名列第一。
Gemini 1.5 Pro (0801) 在多语言任务中表现出色,在数学、硬提示和编码等技术领域表现强劲。热烈祝贺 @GoogleDeepMind 取得这一非凡的里程碑!
Gemini (0801) 类别排名:
  • 总排名 #1
  • 数学 #1-3
  • 遵循指令:#1-2
  • 编码 #3-5
  • 硬提示(英语): #2-5
更多分析如下👇
notion image
Gemini 1.5 Pro(实验版 0801)在 Vision Leaderboard 上排名第一。
notion image
notion image
Gemini 显示出强大的多语言能力: #在中文、日文、德文、俄文中均排名第一。
notion image
notion image
但在编码/硬提示等技术领域的竞技中,Claude 3.5 Sonnet、GPT-4o、Llama 405B 仍遥遥领先。
notion image
notion image
总胜率热图: Gemini 1.5 Pro (0801) 对 GPT-4o 的胜率为 54%,对 Claude-3.5-Sonnet 的胜率为 59%。 请访问 https://chat.lmsys.org/?leaderboard 查看完整数据,并与模型交流!
notion image
  • Google Gemini
  • GPT4o
  • SearchGPT 原型实测Llama 3.1 vs GPT-4o
    Loading...
    目录