PD虚拟机     VPS     Win11     微软     苹果     SetApp     Office     精选

震撼!ChatGPT 重大进化 - 现 ”能看 (识图) 能听又会说”了!

王炸更新 - 视频演示      , ,    ,
0 下载

之前,我们一直都是使用文字与 ChatGPT 等人工智能进行交流。而现在,ChatGPT 终于迈出了“多模态”变革的全新一步——现在 AI 可以基于图像进行分析和对话了!同时,也能进行语音合成,将结果直接说出来了。

ChatGPT Plus

推荐:支持开通 ChatGPT Plus 的虚拟卡

最近,ChatGPT 进行了一次重大升级,ChatGPT Plus 会员不管是使用 GPT-4 还是 GPT-3.5 模型,现在都能够给 AI 发送照片图片,让它进行分析,并针对图像内容进行对话了。这一升级将完全改我们与 AI 之间的交互。

ChatGPT 会识图了!

在新版的 ChatGPT 中,增加了全新的「图像识别」功能,用户可以通过上传一张或多张图像,配合 GPT-3.5 或 GPT-4 模型进行对话。

OpenAI 在宣传博客中表示,这个功能可以应用于各种日常场景,比如通过拍摄冰箱和食品储藏室的照片,让 AI 帮你决定晚餐吃什么,或者针对纸质办公文档进行提问等。而且,你还可以在设备的触摸屏上圈出你希望 ChatGPT 关注的图像部分,让它更加特别关注你想要问的具体内容。

ChatGPT 手机版

就像下面的一个演示视频里展示的一样,用户可以直接向 ChatGPT AI 模型怎么调整自行车的座椅。然后他给 AI 发了几张照片:单车、使用手册和手上的工具箱的照片。之后,AI 就根据图片上的内容,给用户做出非常详细具体的回答。

ChatGPT 识别图片的实测演示视频:

在这个例子中,ChatGPT 就会根据图片中的车型告诉用户,有些车是用快拆杆,有些则是用螺栓固定的。然后它会给你详细的步骤,告诉用户具体怎么操作。

然后,该用户拍了一张 (并非) 螺栓的照片,还用画图工具把它圈出来,好让 ChatGPT 看到并注意。然后官方问 ChatGPT,这是不是快拆杆。ChatGPT 很明确地告诉用户不对,这是螺栓,你需要找一个内六角扳手来操作。

接着,用户又拍了一张工具箱的照片,问 ChatGPT 到底是哪一个扳手。ChatGPT 很厉害地认出了扳手,并且准确地提示用户应该拿哪个尺寸的扳手来使用。

整个过程看起来相当的“科幻”!!没想到,当年我们一直在幻想的这样的情景,居然现在已经完完全全实现了。尽管从 ChatGPT 的诞生,我们就预料到这样的情景迟早会到来,没想到的是,居然这么快就真的实现了~

ChatGPT 能说话了!

除了上述提到的功能,OpenAI 还为我们带来了一个很酷的东西,就是支持语音合成——能说话了!它将语音识别、转录和音频生成的功能集成到了 AI 中去。这个功能目前只能在 ChatGPT 的 iOS 和安卓客户端上使用。但目前不知道语音合成(说话功能)会不会支持中文。

ChatGPT 语音合成实测视频:

你可以利用这个功能给家里的小孩讲睡前故事,或者当你和家人吃饭的时候突然为了某个问题而吵起来时,你只需把 ChatGPT 放在桌子上,它就能帮你解决争论啦!听起来是不是很方便有趣呢?

ChatGPT Plus 会员抢先体验:

总的来说,OpenAI 已经开始给 ChatGPT 赋予「看、听、说」的能力了!接下来的两周内将给 ChatGPT Plus 会员和 Enterprise 订阅用户带来这些惊人的新功能,而且他们还特别说明了,语音合成只能在 iOS 和安卓应用上使用,而图像识别功能在网页和移动应用上都可用的。

虚拟信用卡开卡教程
支持绑定 ChatGPT Plus 的虚拟卡

所以,ChatGPT Plus 除了 GPT4.0 外,又出现更加值回票价的新功能了!如果你需要订阅,可以参考异次元推荐的「虚拟信用卡开卡教程」,可以轻松解决国内银行卡无法绑定和付款的问题。

/ 关注 “异次元软件世界” 微信公众号,获取最新软件推送 /

赞赏异次元


请通过支付宝、微信 APP 扫一扫,海外读者可「使用 PayPal 赞赏

“ 感谢您对异次元网站的支持! ”