ootdiffusion_pytorch AIGC虚拟衣物试穿算法模型

最新推荐文章于 2024-09-30 16:26:34 发布

技术瘾君子1573

最新推荐文章于 2024-09-30 16:26:34 发布

阅读量928

点赞数 27

分类专栏：人工智能&深度学习&机器学习文章标签： pytorch AIGC 算法虚拟衣物试穿模型

本文链接：https://blog.csdn.net/qq_27815483/article/details/141391340

版权

人工智能&深度学习&机器学习专栏收录该内容

159 篇文章 3 订阅

订阅专栏

OOTDiffusion

论文

OOTDiffusion: Outfitting Fusion based Latent Diffusion for Controllable Virtual Try-on

https://arxiv.org/pdf/2403.01779

模型结构

该模型基于Stable Diffusion，通过添加Outfitting Unet学习衣物特征。

算法原理

该算法基于Stable Diffusion，通过使用额外的Unet网络学习衣物特征，并使用cross-attention融入主干网络。

环境配置

Docker（方法一）

docker pull image.sourcefind.cn:5000/dcu/admin/base/pytorch:2.1.0-centos7.6-dtk24.04-py310

docker run --shm-size 10g --network=host --name=ottd --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -v /opt/hyhal:/opt/hyhal:ro -it <your IMAGE ID> bash

pip install -r requirements.txt

Dockerfile（方法二）

docker build -t <IMAGE_NAME>:<TAG> .

docker run --shm-size 10g --network=host --name=ottd --privileged --device=/dev/kfd --device=/dev/dri --group-add video --cap-add=SYS_PTRACE --security-opt seccomp=unconfined -v 项目地址(绝对路径):/home/ -v /opt/hyhal:/opt/hyhal:ro -it <your IMAGE ID> bash

pip install -r requirements.txt

Anaconda (方法三)

1、关于本项目DCU显卡所需的特殊深度学习库可从光合开发者社区下载安装： https://developer.hpccube.com/tool/

DTK驱动：dtk24.04
python：python3.10
torch: 2.1.0
torchvision: 0.16.0
onnx: 1.15.0

Tips：以上dtk驱动、python、torch等DCU相关工具版本需要严格一一对应

2、其它非特殊库参照requirements.txt安装

pip install -r requirements.txt

数据集

名称	链接
VITON-HD	github SCNet 高速下载通道
Dress Code	github SCNet 高速下载通道

训练

cd train
mkdir -p checkpoints/unet_garm checkpoints/unet_vton

HIP_VISIBLE_DEVICES=0,1,2,3 python main.py

注意：该训练代码为非官方实现，目前仅支持VITON-HD类数据集的训练。

推理

命令

半身

# model_path表示任务图片
cd OOTDiffusion/run
python run_ootd.py --model_path <model-image-path> --cloth_path <cloth-image-path> --scale 2.0 --sample 1

全身

# category = 0 上半身，1 下半身，2 裙子
cd OOTDiffusion/run
python run_ootd.py --model_path <model-image-path> --cloth_path <cloth-image-path> --model_type dc --category 2 --scale 2.0 --sample 1

webui

cd OOTDiffusion/run
python gradio_ootd.py

result

	人物	衣物	结果
hd
dc

精度

ssim	lpips
0.86	0.075

注意：该精度在size=(512, 384)条件下训练及测试得到，与官方实现（未开源）可能存在不同。

应用场景

算法类别

AIGC

热点应用行业

零售,广媒,电商

预训练权重

model	url
OOTDiffusion	huggingface SCNet 高速下载通道
clip	huggingface SCNet 高速下载通道

下载链接中的所有模型文件，并放入checkpoints文件中。

checkpoints/
├── clip-vit-large-patch14
│   ├── config.json
│   ├── merges.txt
│   ├── preprocessor_config.json
│   ├── pytorch_model.bin
│   ├── special_tokens_map.json
│   ├── tokenizer_config.json
│   ├── tokenizer.json
│   └── vocab.json
├── humanparsing
│   ├── download.sh
│   ├── exp-schp-201908261155-lip.pth
│   ├── exp-schp-201908301523-atr.pth
│   ├── parsing_atr.onnx
│   └── parsing_lip.onnx
├── ootd
│   ├── feature_extractor
│   │   └── preprocessor_config.json
│   ├── model_index.json
│   ├── ootd_dc
│   │   └── checkpoint-36000
│   │       ├── unet_garm
│   │       │   ├── config.json
│   │       │   └── diffusion_pytorch_model.safetensors
│   │       └── unet_vton
│   │           ├── config.json
│   │           └── diffusion_pytorch_model.safetensors
│   ├── ootd_hd
│   │   └── checkpoint-36000
│   │       ├── unet_garm
│   │       │   ├── config.json
│   │       │   └── diffusion_pytorch_model.safetensors
│   │       └── unet_vton
│   │           ├── config.json
│   │           └── diffusion_pytorch_model.safetensors
│   ├── scheduler
│   │   └── scheduler_config.json
│   ├── text_encoder
│   │   ├── config.json
│   │   └── pytorch_model.bin
│   ├── tokenizer
│   │   ├── merges.txt
│   │   ├── special_tokens_map.json
│   │   ├── tokenizer_config.json
│   │   └── vocab.json
│   └── vae
│       ├── config.json
│       └── diffusion_pytorch_model.bin
├── openpose
│   └── ckpts
│       └── body_pose_model.pth
└── README.txt