OpenAI｜全网为Sora疯狂！

最新推荐文章于 2024-10-18 00:00:00 发布

Student Li

最新推荐文章于 2024-10-18 00:00:00 发布

阅读量850

点赞数 20

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41451303/article/details/136226333

版权

本文介绍了OpenAI发布的视频生成模型Sora，其能够根据文本描述生成高质量视频。文章详细阐述了Sora的特点，如理解和物理世界、语言深度等，同时也指出了其存在的不足，如物理过程模拟和空间细节理解。最后，作者讨论了Sora的体验和人工智能技术的发展趋势。

摘要由CSDN通过智能技术生成

前言

大家好，我是李同学，感谢各位的点赞、收藏、评论

2月16日凌晨OpenAI发布了文本生成视频的新应用模型Sora

官方出品必属精品！

Link：openai.com/sora

20240217083703

本文阅读成本与收益如下：

阅读耗时：3mins

预期效益

认识Sora
了解Sora的不足
如何体验Sora的能力
Sora技术原理分析报告

认识`SORA`

Sora是OpenAI首个视频生成模型，拥有与DALL·E 3的画面质量以及指令能力

Sora 在日语中意为天空，之所以选择这个名字，是希望它能激起无限的创造潜力。

该模型可以帮助用户通过简单的文本描述视频中的内容，即可在短时间内得到一个分钟级别的视频素材

官方给出来不少prompt生成视频的例子：

一位富有气质的女生走在人来人往的街道上：视频呈现的效果如同真实摄像机拍摄得到，镜头距离人物由远到静，甚至可以生成人物的细节，模拟特写效果

20240217084438

生成一段加州淘金热时期的历史录像：视频画质稍带历史年代感的模糊效果，内容方面模拟了古代村落的景观

20240217084622

......

当然还有非常多的例子，这里不一一列举，感兴趣的小伙伴执行查看官网的视频～

总的来说 Sora 能够生成具有多个角色、特定运动类型以及主题和背景的准确细节的复杂场景，并具有以下特性

理解用户在提示中所要求的内容，而且还理解这些事物在物理世界中的存在方式。
对语言有着深刻的理解，使其能够准确地解释提示，并生成令人信服的字符
能够表达充满活力的情感
在一个生成的视频中创建多个镜头，以准确地保存字符和视觉风格

了解`Sora`的不足

Sora目前存在明显弱点，可能难以非常准确保证模拟复杂场景的物理过程，也可能无法理解因果关系的具体实例。比如：一个人可能咬了一口饼干，但之后饼干上可能没有咬痕。

该模型还可能混淆提示的空间细节，例如：混淆左右，并可能难以准确描述随着时间发生的事件，比如跟随特定的摄像头轨迹。

例子：

步进打印一个人奔跑的场景，电影胶片拍摄在35毫米。（制造出身体上令人难以置信的动作：人在跑步机上的跑步方向不寻常）

20240217085332

五只灰狼幼崽在一条偏远的砾石路上嬉戏，相互追逐，周围是草。幼崽们奔跑跳跃，互相追逐，相互咬咬，嬉戏。（制作了一段动物不断增加的视频：狼的数量会变化，一些凭空出现或消失）

20240217085748

如何体验`Sora`的能力

暂时还没收到官方的邀请，有兴趣的小伙伴可以一起蹲一下哈

感受

从22年的ChatGPT、midjourney的模型生文生图，到今天的视频生成的只用了短短的一年时间，这一年以来关于人工智能的各种出圈都非常让人震惊，仿佛每隔几个月都开始科技圈 / 技术圈的一次盛宴，AIGC带来的能力逐渐从台后来到台前帮助人们更好的工作与生活，未来内容生成的应用将会更加的广泛。

参考

官方模型首页：openai.com/sora
官方研究报告：openai.com/research/vi…
NaViT，适用于任何宽高比和分辨率的视觉转换器：arxiv.org/pdf/2307.06…
知乎Sora技术相关优秀回复：www.zhihu.com/question/64…

讲到最后

2024新年假期接近尾声，准备上班了，写篇文章热热身，争取2024持续输出内容～

关注

20
点赞
踩
18

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Student Li CSDN认证博客专家 CSDN认证企业博客

码龄7年

68: 原创

6万+: 周排名

10万+: 总排名

14万+: 访问

: 等级

1080: 积分

237: 粉丝

210: 获赞

44: 评论

291: 收藏

私信

关注

热门文章

分类专栏

闲谈 1篇
php 23篇
docker 7篇
数据库优化 3篇
大流量访问 3篇
大型项目架构 2篇
laravel 8篇
golang 1篇
xlswriter 3篇
正则 1篇
vue 1篇
linux 1篇
服务器安装 2篇
Mac 2篇
lnmp 1篇
简单搭建个人博客 3篇
mysql 11篇
thinkphp 11篇
layui 4篇

最新评论

[精选]通义灵码做活动，送挺多礼品，快来薅羊毛！！！
wypdao: 100积分有啥用
[精选]通义灵码做活动，送挺多礼品，快来薅羊毛！！！
Student Li: 「通义灵码 · 体验 AI 编码，开 AI 盲盒」参与地址：https://developer.aliyun.com/topic/lingma/activities/202403?taskCode=14508&recordId=a559ee76fb387118328a69b0cc4cd090#/?utm_content=m_fission_1 (百分百中奖, 起码中个台历） [腾讯云] 2核2G4M，61元/1年, 560元/3年；2核4G5M，900元/3年活动地址：https://curl.qcloud.com/xC8nPflw (老用户换QQ或邮箱注册，页面中间3年配置，同一实名享新用户特价）
[精选]通义灵码做活动，送挺多礼品，快来薅羊毛！！！
Student Li: 大家帮帮忙点点链接注册下，谢谢各位大老板了，点解链接注册的大老板，今年个个发大财，身体健康，写代码无BUG！！！
sora给普通人带来的赚钱机遇
RandomLifeX: 就是为了用AI赚钱
sora给普通人带来的赚钱机遇
Hacker-666: AI网红以后肯定会越来越多

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Student Li 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。