2024年的2月15日,openAI再放大招,发布了一个文本转视频的新模型Sora。简单来说,Sora就是通过文字或者语言,能够直接生成视频的大模型。但是,openAI并没有简单将其定义为视频模型,而是采用了“世界模拟器”的的称呼,或许这代表着openAI公司所创建的Sora模型能够结合更多真实的物理定律,带给人现实世界的感受。Sora的发布说明了AI已经从文本,对话等语言沟通能力,进化到了视频处理,图像输出等以前难以想象的地步。
OpenAI展示文生视频工具Sora,效果惊艳,48段视频+提示词展示_哔哩哔哩_bilibili
或许看到这里,你还觉得似乎Sora也没那么神奇,只不过是能够输出视频罢了。但是当你看到它生成的视频之后,你还是会惊叹于Sora的神奇。
以上的截图和视频,如果没有给出说明,你大概率不会相信这是由AI创作生成的。从鸟瞰的视角,再到人物的近距离特写,从跟拍的镜头再到慢动作下的粒子分析,Sora的表现都让人大吃一惊。在以往,可能这些视频需要几周或者几个月的人工剪辑,但是Sora可能只需要几个小时,甚至几十分钟。我们似乎进入了AI的蒸汽时代。
从远古社会,AI的空白期,再到农耕时代的chatgpt横空出世,YOLO的一鸣惊人,再到现在Sora的惊鸿一瞥,AI的进化速度似乎超过了我们的想象。现目前Sora在细节处理上,比如对汉字的处理,或者是对于一些复杂场景的理解,还有待加强,但AI的时间还有很多。期待sora能够在未来发挥出更好的实力。
Sora 官网: