ChatGPT:我希望在不久的将来看到 5 项变化

自ChatGPT发布以来已逾一年,期间该聊天机器人经历了多次迭代,增添了自定义指令、引入GPT及GPT-4 Turbo等新型模型等功能。然而,在这一年的竞争历程中,微软Copilot与谷歌Gemini等竞争对手在某些场景下展现出了比ChatGPT更出色的表现。
尽管ChatGPT至今依然备受欢迎,但我坚信它能从竞争对手那里汲取灵感。因此,以下是我期望在未来数月内ChatGPT能实现的五大改进:
- 全面搜索与事实核查能力
大型语言模型(如支撑ChatGPT的模型)存在一个显著问题:幻觉现象。这指的是现代AI倾向于生成看似合理却充满事实错误或完全虚假的文本。通过将ChatGPT与互联网“相连”,可以显著缓解这一问题,正如我们会在Google上搜索查询一样。
ChatGPT在2023年初获得了搜索互联网的功能,但此功能一直仅限于付费用户。具体来说,用户需每月支付20美元订阅ChatGPT Plus,才能享受网页浏览支持。相比之下,Copilot、Perplexity AI和Gemini等聊天机器人则将此功能作为标准配置免费提供。
鉴于此,我呼吁OpenAI为所有用户提供网页浏览支持,无论其订阅状态如何。否则,ChatGPT可能会继续传播不准确的信息,进而长期损害其声誉。我认为我的要求并不过分——OpenAI可以继续将更先进的GPT-4模型保留在订阅服务之后。
- AI生成艺术作品与图像编辑的改进
ChatGPT起初是一个纯粹的文本聊天机器人,但随后获得了创作AI生成艺术作品的能力。它借助OpenAI自家的DALL-E文本转图像模型,能够呈现出色的结果。然而,它缺乏直接使用AI图像生成器所能获得的诸多功能。
ChatGPT仅能根据文本提示创建图像,无法对单个图像进行细微修改(除非用户不介意聊天机器人创建一系列全新图像),也不能上传自己的照片或图像并要求AI进行编辑(尽管这是DALL-E的一项功能)。此外,ChatGPT无法将用户喜欢的图像放大至更高分辨率。一种解决方案是使用ChatGPT的代码解释器执行基本编辑,但这只是利用编程工具而非AI。
鉴于ChatGPT将图像生成功能锁定在付费订阅之后,我期望这些与AI艺术相关的功能能够向所有聊天机器人用户开放。毕竟,无论订阅级别如何,Stable Diffusion和Midjourney等竞争对手都提供这些功能。甚至三星的Galaxy AI软件套件现在也允许用户在智能手机上免费执行基于AI的图像编辑。
- 完整的数字助理体验
数月前,我撰写了一篇关于ChatGPT语音聊天功能的详细文章,该功能允许用户与聊天机器人进行长时间的来回对话。该功能最终从付费级别降级为免费,意味着现在任何人都可以使用它。然而,它仍然相对默默无闻,大多数人甚至不知道其存在。
该模式仅通过移动应用程序提供,目前仅是聊天机器人的语音扩展。时间快进到今年早些时候,我们发现代码表明ChatGPT很快将允许用户将其设置为Android上的默认助手。不幸的是,谷歌在2月份发布了Gemini,抢占了先机,它现在可以替换助手,甚至能执行设置提醒等基本任务。
ChatGPT的语音聊天模式值得获得更多关注和开发。然而,对于那些钟爱ChatGPT对话体验的人来说,我期望该功能能够持续发展。我还期待聊天机器人能够执行一些任务,如设置计时器、获取新闻和控制智能家居设备。
目前,每次你想提问时,都需要打开ChatGPT移动应用并点击耳机图标。我知道这感觉很过时。
- 减少闲聊体验
你可能认为我要求聊天机器人输出更少文本是疯狂的举动,但请听我解释。当你向ChatGPT提问时,通常只是在寻找少量信息。那么为什么每次使用ChatGPT时,都必须先阅读冗长的前言才能得到答案呢?在使用Siri和Google Assistant时,我确实期望得到更长的回复,但ChatGPT却走向了另一个极端。
我认为Microsoft Copilot在冗长与信息量之间找到了完美的平衡点。它提供三种不同的聊天模式:创意、平衡和精确,每次发起对话时都可以选择。正如你从标题中预料的那样,精确模式会将聊天机器人的输出压缩为几句话,而创意模式则会提供更像ChatGPT的响应。
如果ChatGPT的回复更少或聊天模式更加多样化,我会更频繁地使用聊天机器人,当然,我希望这不会以牺牲准确性为代价。
- 与外部服务的原生集成
如果你曾使用过Gemini,可能已经注意到它可以读取你Gmail中的电子邮件,甚至能与各种Google服务(如Docs、Maps和Flights)进行交互。这是你对真正的数字助理所期望的整合水平,但在使用ChatGPT时,这种体验完全不存在。
即使在付费套餐中,你也只能使用自定义GPT功能与Wolfram Alpha和Kayak等外部平台进行交互。虽然这些功能很有用,但需要你费尽心思才能启用,并且只能在聊天期间持续使用。OpenAI已停止使用插件功能,这也无济于事,该功能可同时将多个外部服务引入你的聊天中。
真正的助手应该能够帮助我预订航班、规划日程等等。
我相信真正的下一代ChatGPT是能够代表我与第三方服务进行交互而无需事先指示的聊天机器人。同样,我认为如果聊天机器人能够读取我的电子邮件和日历(当然需要事先征得同意),它会更加有用。这些变化将使ChatGPT感觉更加个性化并赋予它更多自主权。