当地时间周一,OpenAI宣布正式向用户开放人工智能(AI)视频生成模型Sora,该系统可以根据文本提示生成逼真的视频,这距离OpenAI首次公开预览这款产品已过去了10个月时间。
根据OpenAI的介绍,Sora将于当天晚些时候向美国及其他市场的ChatGPT付费用户开放。新版工具Sora Turbo可以生成最长达20秒的视频,并且可以提供这些视频的多种变体。
自今年2月首次预告Sora以来,OpenAI便开始与电影制片厂、媒体高管以及经纪公司展开会谈。OpenAI还允许一些艺术家、知名演员和导演试用该服务。
OpenAI声称Sora是一项理解和模拟现实的基础性AI技术,是开发能够与物理世界互动模型的重要一步。
然而,Sora在早期测试中显示出明显的局限性。据悉,在一次测试中,Sora存在“多余肢体”的问题,并对物理现象的理解不够准确。此外,与图像生成器或聊天机器人相比,Sora生成每个视频所需的时间和算力明显更多了。
OpenAI首席执行官奥尔特曼表示,初期Sora的使用仍然受限,ChatGPT Plus订阅用户可以每月生成50个低分辨率视频,ChatGPT Pro订阅用户可以无限制的“较慢”生成高分辨率视频,以及500个快速生成的视频。
除了视频生成的数量和速度会有限制之外,Sora在欧洲大部分地区也无法使用,因为欧洲的科技监管更严格。
在周一的演示中,OpenAI还展示了Sora的新功能。该公司表示,该工具不仅可以通过文本提示生成视频,还能够基于静态图片和已有视频创建新的内容。例如,用户可以上传一段视频剪辑,Sora会生成扩展这个片段的后续画面,使视频变得更长、更完整。
Sora还包含一个名为Storyboard的选项,用户可以通过它详细描述希望视频在不同时间点发生的内容,从而更好地指导一系列片段的生成。此外,Sora还提供了一个功能,让用户可以浏览其他人创作的视频集锦。
Sora的发布是OpenAI为期12天的产品直播活动的一部分,上周已推出了更昂贵的ChatGPT Pro订阅选项,可无限制访问OpenAI最强大的AI模型。
虽然Sora是世界上第一个视频生成模型,但自它问世以来,同类产品已经是百花齐放,比如Google的Veo、快手可灵、Runway的Gen-3、字节跳动PixelDance等。
与此同时,这些可以快速地制作视频的工具正在颠覆影视行业,人们已经开始探索如何将这项技术应用于电影制作。
(文章来源:财联社)