OpenAI 发布“王炸” Sora 模型可「文字生成视频」且影片质量惊人!
- 11.11 好价整理 | 腾讯视频+京东 ¥148 | 百度网盘年卡+芒果 ¥179 | 哔哩哔哩年卡 ¥88
- 夸克网盘 SVIP 年卡 | WPS 会员四年 | QQ会员买一得14 | 爱奇艺 15 个月 | QQ音乐年卡
ChatGPT 的公司 OpenAI 最近发布了一款全新“逆天”级别的 AI 视频生成模型,名字叫 Sora (日文“天空”的意思)。Sora 能够根据文字描述快速生成视频,创造出逼真而富有想象力的场景,目前已可根据用户的提示词制作出长达一分钟极其流畅以及细节超级逼真的视频。
可以说这次真的被 OpenAI 的 Sora 震惊掉下巴,从视频的质量可以看到几乎吊打 90% 的视频内容创作者,特别是对于个人或小团队,还自己搞灯光摆场景瞎拍半个月,现在直接敲几个字等几分钟就实现,效果还直逼好莱坞电影级别!
据 OpenAI 的官方介绍,Sora 可以制作出“带有多个角色、各种动作类型、以及细致准确的主体和背景细节”的复杂场景。他们还说,这个模型能够理解物体在现实世界中的存在方式,还能“准确表达道具并生成出充满生动感情的引人注目的角色”。
更炫的是,这个模型能根据静态图像生成视频,甚至还能为现有的视频往前或往后扩展,生成出延长的视频内容,效果非常的炸裂。上面就是一些官方制作的视频演示。
OpenAI 的博文里展示了 Sora 创造的一些范例,比如加利福尼亚淘金热时期的空中场景,以及从东京火车内部拍摄的视频等。这些演示中都有人工智能的痕迹,比如有一段视频里,看起来地板好像在移动。OpenAI 表示,虽然模型“可能难以准确模拟复杂场景的物理现象”,但整体来说,这些演示结果是相当令人印象深刻的。
几年前,像 Midjourney 这样的文本到图像生成器在将文字转化为图像方面一直领先。但是最近,视频技术突飞猛进:Runway、Pika 等公司都展示了让人印象深刻的文字转视频模型,而 Google 的 Lumiere也将成为 OpenAI 在这一领域的主要竞争对手之一。和 Sora 类似,Lumiere也提供了文字转视频的功能,还可以让用户通过静态图像制作视频。
据说现阶段 Sora 只对小部分成员开放,他们负责评估模型的潜在危害和风险。OpenAI 也向一些视觉艺术家、设计师和电影制片人提供了访问权限,以获取反馈意见。他们指出,现有模型目前也有一些局限性,比如可能无法准确模拟复杂场景的物理现象,也可能无法正确解释某些因果关系等等。
最后,Sora 模型具体什么时候能开放给所有的普通用户暂时还不清楚,估计后续能用了之后,会首先下放给 ChatGPT Plus 的会员,然后应该也会像 Dall·E3 一样,会直接集成到 ChatGPT 中。
/ 关注 “异次元软件世界” 微信公众号,获取最新软件推送 /
如本文“对您有用”,欢迎随意打赏异次元,让我们坚持创作!
赞赏一杯咖啡