[论文笔记] Open-Sora 4、sora复现训练过程 (新repo)

心心喵

已于 2024-03-24 00:39:44 修改

阅读量768

点赞数

分类专栏：论文笔记文章标签：论文阅读

于 2024-03-19 12:22:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Trance95/article/details/136808872

版权

论文笔记专栏收录该内容

158 篇文章 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

本文记录了Open-Sora项目中复现Sora视频生成模型的训练过程，包括选择架构的效率考量，环境安装，数据下载（如HD-VG-130M和Inter4k）及处理，模型训练的挑战，以及遇到的Transformer Engine Extensions错误的解决方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

sudo -H pip install --upgrade youtube-dl -i https://pypi.doubanio.com/simple/

一、概况

OpenAI 的 Sora 在生成一分钟高质量视频方面非常出色。然而，它几乎没有透露任何有关其细节的信息。为了让AI更加“开放”，致力于打造Sora的开源版本。本报告描述了colossal-ai首次尝试训练基于 Transformer 的视频扩散模型。

选择架构的效率

为了降低计算成本，我们希望利用现有的 VAE 模型。Sora 使用时空 VAE 来减少时间维度。然而我们发现目前还没有开源的高质量时

了解本专栏

超级会员免费看

博客等级

码龄8年

765
原创

746
点赞

1155
收藏

6321
粉丝

关注

私信

热门文章

分类专栏

论文笔记付费 158篇
机器学习付费 33篇
算法导论付费 170篇
nlp 付费 116篇
redis
paddle
预训练语言模型 2篇
机器视觉
OT 3篇
强化学习 1篇
java 7篇
linux 151篇
RS 8篇
c 5篇
c++ 13篇
python 28篇
tensorflow2.0 7篇
深度学习 14篇
笔记
pytorch 7篇
LRFR 1篇
论文 2篇
cv 13篇

最新评论

[论文笔记] Deepseek技术报告解读: MLA&MTP
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑
心心喵: 就是有缓存过tokenizer 的cache的情况下，优先读取path中已经缓存的结果
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑
chuangzhidian: 没看到
[论文笔记] llama-factory 微调qwen2.5、llama3踩坑
chuangzhidian: tokenized_path在哪里注释呢？
[论文笔记] GRPO & DPO
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

心心喵 喵喵(*^▽^*）

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。