OpenAI发布Sora模型,可根据文字生成逼真AI视频

早在2022年11月30日,OpenAI第一次发布人工智能聊天机器人ChatGPT,随后在全世界掀起了人工智能狂潮,颠覆了一个又一个行业。在过去的一年多的时间里,chatGPT的强大功能改变了越来越多人的工作和生活方式,成为了世界上用户增长最快的应用程序。

昨天,OpenAI发布了一款新的AI产品Sora,用户只需输入文本,即可生成一段极其逼真且富有想象力的视频,从而将战事正酣的AI竞赛引向好莱坞。如果说,OpenAI旗下的ChatGPT可以在不上法学院的情况下通过律师考试,而Sora则希望在不上电影学院的情况下拍摄电影。

OpenAI称,Sora能够根据文本指令生成一段60秒的视频,同时保持视觉质量。它对语言有深刻的理解,能够准确领会提示,生成令人信服的角色。Sora可生成具有多个角色、特定类型运动、精确主题和背景细节的复杂场景。还可以在单个生成视频中创建多个镜头,准确保留角色和视觉风格。

OpenAI今日还分享了几个样本视频,证明了通过文本生成视频的可能性。分析人士称,这是一个新的研究方向,也是2024年值得关注的一个趋势。OpenAI科学家Tim Brooks表示:“建立一套大模型,能够理解视频,理解我们世界中所有这些非常复杂的交互,是未来所有AI系统的重要一步。”

就在OpenAI发布Sora之前的几个小时,Google还刚刚推出了它最强的LLM Gemini1.5,并试图宣称自己终于杀死了GPT-4,然而,显然现在没人关注这个了。因为看完Sora你可能会发现,OpenAI自己可能要用它先杀死GPT-4了。

有了SORA,每个人都可以创造自己的世界了

自从OpenAI发布GPT-4以来,人们一直期待GPT-5,但Sora带来的轰动不亚于一次GPT-5的发布。

作为OpenAI 首推的文本转视频模型,Sora能够根据文本指令或静态图像生成长达 1分钟的视频,其中包含精细复杂的场景、生动的角色表情以及复杂的镜头运动。同时也接受现有视频扩展或填补缺失的帧。

每条提示60秒的视频长度与Pika Labs的3秒、Meta Emu Video的4秒、和Runway公司Gen-2的18秒相比,妥妥地铁赢了。并且从官方发布的演示来看,无论从视频流畅度还是细节表现能力上,Sora的效果都相当惊艳。

比如官推里这条14秒的东京雪景视频。

提示词:Beautiful, snowy Tokyo city is bustling. The camera moves through the bustling city street, following several people enjoying the beautiful snowy weather and shopping at nearby stalls. Gorgeous sakura petals are flying through the wind along with snowflakes.

“美丽的,被雪覆盖的东京正繁忙着。镜头穿过繁忙的城市街道,跟随着几个享受雪景和在附近摊位购物的人。美丽的樱花瓣随风飘落,与雪花一同飞舞。”

穿着时尚的女性漫步在霓虹背景的东京街头,地面有积水倒影。

对于五官和皮肤的刻画十分真实,特别是痘印和法令纹,细节让人惊叹。

猛犸象自冰川雪原中缓步从来,背后升腾起雪雾。

烛火旁纯真顽皮的3D动画小怪物,光影、表情和毛茸茸的细节满分:

一名24岁女性的眼部特写,足以以假乱真:

无人机视角的海浪拍打着Big Sur加瑞角海岸崖壁,落日洒下金色光芒:

还有咱们中国的老百姓上街舞龙,庆祝中国农历春节:

目前Sora还在测试阶段,仅对部分评估人员、视觉艺术家、设计师和电影制作人们开放访问权限,拿到试用资格的人们已经开始想象力横飞。</

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值