SORA大模型的一点分析与理解

猴猴猪猪

已于 2024-03-13 09:12:59 修改

阅读量283

点赞数 4

分类专栏： AIGC 文章标签：人工智能深度学习论文阅读 AIGC 计算机视觉

于 2024-02-18 14:33:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pku_langzi/article/details/136151513

版权

AIGC 专栏收录该内容

11 篇文章 5 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

本文分析了SORA模型，这是一种基于大规模视频数据训练的文本条件扩散模型，能处理不同时长、分辨率和长宽比的视频。通过时空补丁上的变换器架构，该模型能生成高保真视频。文章讨论了视频生成相关工作、将视觉数据转化为补丁的方法、视频压缩网络、时空潜在补丁、扩散模型的应用以及语言理解等关键点，展示了SORA在模拟物理世界方面的潜力。

摘要由CSDN通过智能技术生成

Overview

SORA
- 一、原始技术博客分析

SORA

一、原始技术博客分析

题目: Video generation models as world simulators
机构：OPEN AI
博客地址: https://openai.com/research/video-generation-models-as-world-simulators

1、Overview

We explore large-scale training of generative models on video data. Specifically, we train text-conditional diffusion models jointly on videos and images of variable durations, resolutions and aspect ratios（可变时长，分辨率，长宽比）. We leverage a transformer architecture that operates on spacetime patches of video and image latent codes. Our largest model, Sora, is capable of generating a minute of high fidelity video. Our results suggest that scaling video generation models is a promising path towards building general pur

了解本专栏

超级会员免费看

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
SORA大模型的一点分析与理解

简要分析SORA的技术博客
复制链接

扫一扫

专栏目录

猴猴猪猪 CSDN认证博客专家 CSDN认证企业博客

码龄7年

103: 原创

6万+: 周排名

1万+: 总排名

15万+: 访问

: 等级

2020: 积分

1431: 粉丝

141: 获赞

41: 评论

359: 收藏

私信

关注

热门文章

分类专栏

AIGC 付费 11篇
多模态大模型付费 22篇
python 9篇
VIM 2篇
读书笔记 8篇
常用链接 2篇
目标检测 2篇
matlab 2篇
CNN 2篇
Tensorflow 3篇
阅读论文 15篇
论文写作 1篇
实验记录 8篇
论文笔记 16篇
Pytorch 3篇
编程练习 8篇
LeetCode 9篇
参会学习 1篇
深度学习 3篇
找工作 3篇

最新评论

当自回归遇到Diffusion
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
Sora核心之一：当Diffusion遇到Transformer，DiT的前世今生
?????$%: 感谢分享，有个小错误，256x256的向量经过vae才是32x32。使用的预训练的vae应该是把原尺寸除以8
Sora核心之一：当Diffusion遇到Transformer，DiT的前世今生
春夏秋冬又一年: 感谢整理，您的博客收录到 https://www.webhub123.com/#/home/detail?p=2cDY8-Rmw1
多模态大模型：关于Better Captions那些事儿
普通网友: 目前该问题上还有更加的方法制作数据的方法吗
OPENCV 常用函数
CSDN-Ada助手: kerras 这个库用的多么？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

猴猴猪猪 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。