open sora1.0容器构建教程

算家计算

于 2024-08-19 15:37:50 发布

阅读量1k

点赞数 16

分类专栏：模型构建文章标签： AIGC 人工智能

本文链接：https://blog.csdn.net/SJJS_1/article/details/141327009

版权

166 篇文章

订阅专栏

一、介绍

2024 年 3 月 18 日，Colossal-AI 团队发布了 Open-Sora 1.0 项目，该项目是一个全面开源的视频生成模型项目，旨在高效制作高质量视频，并使所有人都能使用其模型、工具和内容。

Open-Sora 1.0 采用了 Diffusion Transformer（DiT）模型，并在此基础上引入了时间注意力层，以优化对视频数据的处理。
整个架构包括预训练的 VAE、文本编码器，以及利用空间-时间注意力机制的 STDiT（Spatial Temporal Diffusion Transformer）模型。
通过预训练的 VAE 进行视频数据压缩，然后在潜在空间中结合文本嵌入训练 STDiT 扩散模型。在推理阶段，模型从 VAE 的潜在空间中采样高斯噪声，并与提示词嵌入一起输入到 STDiT 中，最终通过 VAE 的解码器生成视频。

下面将以 open sora1.0项目进行部署，由于模型较大建议使用 RTX3090 及以上显卡 。

进入 Anaconda 官网：

找到快速命令行安装，选择 Linux 系统，复制代码进入终端中进行安装。

等待安装完成。

apt-get update
apt-get install -y unzip
apt-get install -y lsof
apt-get install -y git
apt-get install -y git-lfs

使用 Web URL 进行克隆默认下载v1.2.0版本，因此需找到v1.0.0版本的项目进行压缩包下载

上传压缩包至终端，解压。

unzip Open-Sora-Plan-1.0.0

打开文档

cd Open-Sora-Plan-1.0.0

conda create -n opensora python=3.8 -y

conda activate opensora

为了安装速度更快可以将 pip 进行永久换源

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

pip install -e .
apt-get install libgl1
apt-get install libglib2.0-0

打开/Open-Sora-Plan-1.0.0/opensora/serve/gradio_web_server.py

更改最后一行代码为

demo.launch(server_name='0.0.0.0', server_port=8080)

export HF_ENDPOINT=https://hf-mirror.com
python -m opensora.serve.gradio_web_server

耐心等待

出现以下界面即为运行成功

运行成功后获取访问链接，进入 webUI 界面后即可操作：

提示词仅限英文

输入：Sunset over the sea(海上日落)