昨日夜里 OpenAI 举行了约半小时的春季升级亮相会,此次亮相会并不是启动检索引擎,而是基于 GPT-4 启动 GPT-4o 模型,该模型具有文本、IPO上市消息语音和视觉实时推理特性。
该模型提供 GPT-4 级别的能力但速度更快,可以使用文本输入、语音输入亦或者上传图片开展推理,可是 GPT-4o 还可以开启摄像头对画面信息开展实时确认,举个简易的例子:当你出国旅行时就可以拿着 GPT-4o 取景周围的画面然后让 ChatGPT 合作你翻译路标或提供各类提议。
调用 GPT-4o 模型的本周活动出席一览 ChatGPT 可以实时流畅的开展对话,延迟乃至只有 232 毫秒,而 GPT-3.5 的延迟大约有 2.5 秒,也就是存在较为显著的 “卡顿”,GPT-4o 已然没有这种状况,加上 GPT-4o 极其出众的盘点iPhone排行推理能力,诸如 Siri 等语音助理仿佛就像是玩具。

早前苹果与 OpenAI 达成协议,预计将在 iOS 18 中添加由 OpenAI 提供的聊天机器人,如今来看这款聊天机器人应该就是由 GPT-4o 驱动的,为使用者提供更好的无线耳机体验自然语言对话能力。
让人意想不到的是 GPT-4o 居然会向所有人免费启动,当下已然有少数 ChatGPT 使用者获得权限可以免费使用 GPT-4o,无需开通 ChatGPT Plus 订阅会员。
免费使用者使用 GPT-4o 有配额限制,假如开通订阅会员则可以对话更多,晚些时候 OpenAI 也将向企业启动 GPT-4o 模型。
比灰度权限更快的是 API 权限,如今所有开发者都可以获得 GPT-4o 模型的访问权限,可是并不是免费的,但费率只有 GPT-4 系列的一半并且速度更快。
另外 OpenAI 还启动 ChatGPT for Mac 客户端,虽说是在评测但当下客户端部署文件已然在网上研究,应该已然有若干使用者顺运用上这个客户端。
最后,由于 GPT-4o 能力过于出众,一些实时翻译类、进修类、培训类使用或办事将面临巨大压力,例如语言进修使用多邻国 (Duolingo) 股价就呈现了下跌,显然投资者们也考虑到多邻国或许会被这类AI使用替代。
有兴趣的使用者可以访问 OpenAI 官网获取更多信息:https://openai.com/index/hello-gpt-4o/