DynamiCrafter模型构建教程

算家计算

于 2024-09-05 11:31:31 发布

阅读量1k

点赞数 23

分类专栏：模型构建文章标签：图生视频 DynamiCrafter 视频扩散先验大模型文生图 AIGC 人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SJJS_1/article/details/141926611

版权

模型构建专栏收录该内容

166 篇文章

订阅专栏

一、模型描述

DynamiCrafter 是一种（文本-）图像到视频/图像动画的方法，旨在从条件图像和文本提示中生成短视频片段（约 2 秒）。

开发者 ：香港中文大学 & 腾讯 AI 实验室

资助方 ：香港中文大学 & 腾讯 AI 实验室

模型类型 ：生成性（文本-）图像到视频模型

模型资源

Github 仓库（https://github.com/Doubiiu/DynamiCrafter），其中包含了详细的实现代码。

仓库链接 ：https://github.com/Doubiiu/DynamiCrafter

论文链接 ：https://arxiv.org/abs/2310.12190

屏幕截图

二、特点

‌视频扩散先验技术‌：DynamiCrafter 使用视频扩散先验技术来生成动画，这是一种基于深度学习的方法，可以模拟真实世界的运动模式。
‌开放域图像动画化‌：该项目能够处理各种类型的静态图像，包括风景、人物、动物、交通工具、雕塑等，不限于特定的主题或风格。
‌多种主题和风格‌：DynamiCrafter 能够处理多种类型的图像，满足不同创作需求。
‌文本控制运动‌：用户可以通过输入文本指令来控制动画的运动，这为动画创作提供了更大的灵活性和创意空间。
‌高分辨率支持‌：最新的更新推出了高分辨率模型，支持生成 576x1024 和 320x512 分辨率的视频，让用户可以获得更清晰、更细腻的动画效果。

三、部署流程

1. 安装更新基础环境

apt update 
apt upgrade 
apt install build-essential

2. 创建虚拟环境

conda create -n DynamiCrafter python=3.8.5
conda activate DynamiCrafter

3. 克隆项目仓库

git lfs install
git clone https://github.com/Doubiiu/DynamiCrafter.git

4. 打开文件,安装依赖

cd DynamiCrafter
pip install -r requirements.txt

5. 修改访问端口

DynamiCrafter/gradio_app.py打开文件，划到最底部

将server_name设置为'0.0.0.0'、server_port设置为8080

dynamicrafter_iface.launch(server_name='0.0.0.0', server_port=8080, max_threads=1)

6. 运行模型

本地 Gradio 演示，图片到视频生成。

在终端中输入以下命令（根据所需的分辨率：1024、512 或 256 选择一个模型）。

  python gradio_app.py --res 1024

屏幕截图

四、网页演示

开放端口，点击模型运行结束下方的“http://0.0.0.0”,进入网站搜索页面，将“0.0.0.0:8080”改为“127.0.0.1:8080”搜索，即可进入UI界面使用

屏幕截图

博客等级

码龄1年

算家云官方账号

307
原创

4573
点赞

4325
收藏

2539
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

低成本使用满血版DeepSeek R1！基于KTransformer框架的DeepSeek R1 671B本地部署教程
readfor: kt 能让 L20 48G *8能运行Q8？
MinerU容器构建教程
你浩先生: 能不能识别图像？
纯净无噪，智见未来——MAGI-1本地部署教程，自回归重塑数据本质
算家计算: 报错原因是因为save_preset 函数预期接收 2 个参数，但实际接收到了 7 个参数。可以让他更改app.py里面的程序，如下 # 保存预设 def save_preset(name, num_frames, video_size_h, video_size_w, num_steps, window_size, fps): params = [ num_frames, video_size_h, video_size_w, num_steps, window_size, fps ] preset_path = os.path.join(PRESETS_DIR, f"{name}.json") with open(preset_path, "w") as f: json.dump(params, f) return f"预设 {name} 保存成功！"
纯净无噪，智见未来——MAGI-1本地部署教程，自回归重塑数据本质
@小江不emo: 出错了，未找到原因： [code=python] /usr/local/lib/python3.10/dist-packages/gradio/utils.py:1018: UserWarning: Expected 2 arguments for function <function save_preset at 0x7ff6b03cb910>, received 7. warnings.warn( /usr/local/lib/python3.10/dist-packages/gradio/utils.py:1026: UserWarning: Expected maximum 2 arguments for function <function save_preset at 0x7ff6b03cb910>, received 7. warnings.warn( * Running on local URL: http://0.0.0.0:8080 To create a public link, set `share=True` in `launch()`. Traceback (most recent call last): File "/usr/local/lib/python3.10/dist-packages/gradio/queueing.py", line 625, in process_events response = await route_utils.call_process_api( File "/usr/local/lib/python3.10/dist-packages/gradio/route_utils.py", line 322, in call_process_api output = await app.get_blocks().process_api( File "/usr/local/lib/python3.10/dist-packages/gradio/blocks.py", line 2136, in process_api result = await self.call_function( File "/usr/local/lib/python3 [/code]
RAGFlow本地部署教程：多模态检索+动态生成，用AI重构企业知识生产力
算家计算: 原因可能是开发服务器限制。 Flask、Django 等框架自带的开发服务器（如 Werkzeug）性能低、不支持并发请求，且缺乏生产级安全防护。解决方法： 1.安装 WSGI 服务器 pip install gunicorn 2.修改启动命令使用 WSGI 服务器启动应用，而非直接运行 python app.py。假设你的 Ragflow 应用入口文件是 app.py，且应用实例名为 app，则启动命令为： gunicorn --workers 4 --bind 0.0.0.0:5000 app:app --workers: 进程数（建议设为 CPU核心数*2 + 1） --bind: 绑定地址和端口 app:app: 冒号前为文件名（不含 .py），后为应用实例名。您可以试试这个方法哦

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。