🗒️ Gemini 1.5 Pro 综合测试成绩超越 GPT-4o

Gemini 1.5 Pro(实验版0801)在Chatbot Arena测试中以1300分超越GPT-4o和Claude-3.5,首次登顶,表现出色,尤其在多语言任务和数学领域。总排名第一,显示出强大的多语言能力,但在编码和硬提示等技术领域仍落后于其他模型。

🗒️ Llama 3.1 vs GPT-4o

在大多数基准测试中,llama 3.1优于gpt-4o,本文从9.11和9.9比大小、Linkedin标题生成、商业计划、冷邮件和Linkedin邀请函这5个测试对比分析。llama 3.1是一个令人印象深刻的开源项目,有时甚至优于gpt-4o。开源AI将主导未来,闭源AI可能会逐渐消失。

🗒️ 这算不算GPT-4o翻车了?

在户外徒步时,拍了一些果子的照片给GPT-4o,希望它能判断果子的品质。然而,园林专业的同学指出了GPT-4o的错误。人工智能还有很长的发展路程,但仍然对其抱有希望。

没有更多了 😰