创造聊天机器人ChatGPT 的人工智能新创公司OpenAI 周五(16日)发布了文本转影片模型Sora,让用户能透过文字指令生成长达1 分钟的影片。
Sora 能够生成包含多个角色、特定类型的动作以及精确的主体和背景细节的复杂场景。OpenAI 在其官网中写道:
「该模型对语言有着深刻的理解,因此能准确解释提示并生成表达生动情感的引人注目的角色。Sora 也能在单个生成的影片中创建多个镜头,准确地体现角色和视觉风格。」
OpenAI 释出了几个由Sora 生成的影片,并附上影片生成所输入的文字指令。
OpenAI表示,Sora 也能根据现有的静态图片生成影片,准确且细致地让图像内容产生动态效果。该模型还能取用现有影片来延伸内容或填补缺失的帧(frame)。
然而,OpenAI 警告称「目前的模型存在不足之处」,例如它可能难以准确模拟复杂场景中的物理现象,或无法理解特定情况下的因果关系,此外,该模型还可能混淆提示的空间细节,例如左右不分。
OpenAI 执行长阿特曼(Sam Altman)在X 平台上表示,该公司开始针对Sora 进行「红队演练」(red-teaming),并向数量有限的创作者提供访问权限。阿特曼稍早也在X 平台上分享了多段透过Sora 生成的影片。
原创文章,作者:惊蛰财经,如若转载,请注明出处:http://www.xmlm.net/kuang/38705.html