date
category
tag
summary
OpenAI 刚刚发布了 GPT-4o,这是一种新的 AI 模型,免费向所有人提供 GPT-4 级别的 AI。
发布会摘要
上周在 LMSYS 竞技场上的 im-also-a-good-gpt2 聊天机器人实际上就是 GPT-4o
当时的测试结果
gpt2-chatbots 刚刚一跃成为最佳,超越所有模型,领先优势显著(~50 Elo)。它已成为竞技场中有史以来最强大的模型!
OpenAI 的新 GPT-4o 模型首次在 MathVista 上超越人类!
人类平均:60.3 GPT-4o:63.8
* 该模型可以理解音频和视频,甚至可以检测你声音中的情绪。最重要的是,这是实时进行的!
音频
视频
*桌面应用程序和新的用户界面
在 API 中,GPT-4o 的价格是 GPT-4-turbo 的一半,速度是 GPT-4-turbo 的两倍。和 5 倍速率限制。
在编码方面的能力展示
其他补充
GPT-4o简介
GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。它可以在短短 232 毫秒内响应音频输入,平均为 320 毫秒,这与对话中的人类响应时间相似。它在英语文本和代码上的 GPT-4 Turbo 性能相匹配,在非英语语言的文本上也有显着改进,同时在 API 中也更快且便宜 50%。与现有模型相比,GPT-4o 在视觉和音频理解方面尤其出色。
*官方公告
模型能力(16个示例)
能力探索(20个示例)
模型评估(4个示例)
*今晚OpenAI的发布会直播视频如下
官方版本:
翻译版本:
Sam 博客写了他对今天发布的GPT-4o的看法如下
如何使用
已经全量推送
截至 2024 年 5 月 13 日,Plus 用户将能够在 GPT-4o 上每 3 小时最多发送 80 条消息,在 GPT-4 上每 3 小时最多发送 40 条消息。我们可能会减少高峰时段的限制,以使 GPT-4 和 GPT-4o 可供最广泛的人使用。
ChatGPT 免费套餐
免费套餐的用户将默认使用 GPT-4o,并且使用 GPT-4o 可以发送的消息数量受到限制,这将根据当前的使用情况和需求而有所不同。当不可用时,免费层用户将切换回 GPT-3.5。
Free users also receive limited access to messages using advanced tools, such as:
- Data analysis
- File Uploads
- Browse
- Discovering and using GPTs
- Vision
GPT-4o has advanced vision capabilities, which increases accuracy in understanding images you share.
如果没有被灰度到 gpt-4o,可以试试这个 URL:
GPT mac客户端
目前内测账户可用,下载地址:
非内测用户参考宝玉的教程: