重磅惊喜!OpenAI突然上线GPT-4o超长输出模型!「Her」高级语音模式已开放测试!
### OpenAI 面临挑战,推出新功能以挽救地位
在最近的大模型之争中,OpenAI 的领先地位受到了显著的威胁。虽然缺乏具体的数据支撑,但网民的评论体现了用户的流失现象。例如,许多人表示:“Claude 3.5 更好用,为什么不去订阅 Claude 呢?”这样的反馈让 OpenAI 感受到了一定的压力。
随着 Claude 3.5 的推出,OpenAI 持续受到批评,似乎难以找到创新突破口。除了推出 GPT-4o Mini 这个小模型外,OpenAI 在竞争中显得有些力不从心。更不幸的是,近期 GPT-4o 甚至被开源大模型超越,这无疑为 OpenAI 增添了更多的担忧。
根据外媒《信息》(The Information)的预测,OpenAI 可能面临高达 50 亿美元的资金缺口,这是一个极为严峻的信号。在这一背景下,OpenAI 不得不展开反击,近日他们宣布了两项重量级更新:
1. **GPT-4o Voice Mode 语音模式的开放小规模测试**
2. **GPT-4o Long Output 长输出模型的推出**
#### 语音模式的震撼效果
凌晨时分,OpenAI 在推特上发布了关于 GPT-4o Voice Mode 开放测试的消息。OpenAI 从订阅用户中挑选了一部分进行 Alpha 测试,这些用户在 APP 中收到了相关通知和电子邮件。ChatGPT Plus 的订阅用户只需关注自己的 APP,查看是否收到了消息,即可参与这项测试。
有网友提出质疑:为什么语音模式的推出时间从预告的五月拖延至七月底?OpenAI 的回应是,他们在“不断努力提高语音的安全性和质量”,并表示计划在秋季向所有的 Plus 订阅用户开放这一功能。而视频功能和屏幕共享功能的推出则尚需等待。
尽管如此,推特和 YouTube 上已有许多用户分享了他们的体验,效果确实令人震惊。某些用户希望 ChatGPT 成为法语老师,并得到了法语母语者的认可,称其语音发音相当不错!还有网友对其中文发音的评价则有些调侃,甚至开玩笑说:“这声调像极了大佐味!”
总的来说,用户们一致认为其反应速度很快,体验非常愉快。如果有朋友获得了测试资格,欢迎大家分享你的体验感受!
#### 长输出模型的崭新探索
除了语音功能,OpenAI 还悄然开启了 GPT-4o Long Output 的 Alpha 测试。这个新模型的输出 tokens 数量大幅提升,达到 64,000 个,这大约是 200 页小说的长度,与原本的 4,000 个 tokens 相比,增加了整整 16 倍。
需要说明的是,这里指的是最大输出 tokens 的上限,而非上下文长度。GPT-4o Long Output 继续支持最大 128,000 的上下文长度,但用户需要牺牲一些输入 tokens 的上限,以最大化输出能力。
OpenAI 表示推出这一模型的原因是听取了客户的反馈,许多用户渴望更长的输出。这一新模型的定价也略高于原有的模型,每百万个输入 tokens 的费用为 6 美元,而每百万个输出 tokens 则为 18 美元,这相较于 GPT-4o 的 15 美元/百万输出 tokens 的定价有所提升。对于这个价格,市场反应如何仍待观察。
当前在 GPT-4o Long Output 的官方文档中,并未公布其他创新性变革,也就是说,这个长输出模型生成的质量与原有模型并无显著差别。
#### 深度分析与市场反应
综合来看,OpenAI 在面临竞争和挑战时的策略显得十分谨慎。他们为了维持用户的长期订阅,可能会将许多新功能拆分成多个阶段推出,借此逐步提高用户的期待值与市场热度。例如,未来的 GPT-5 或许会在类似的市场策略下出现。
当前我的期待是:希望 GPT-5 能够带来更多创新,同时请不要再搞“候补名单”“小范围测试”之类的了!这样的局面不仅对用户体验造成困扰,也使得市场竞争愈发激烈。OpenAI 需加快脚步,才能在激烈的竞争中再度稳固其市场地位。