LaDI-VTON项目使用教程
1. 项目目录结构及介绍
LaDI-VTON项目的目录结构如下:
ladi-vton/
├── assets/
├── data/
│ ├── noun_chunks/
│ ├── keypoints/
│ ├── label_maps/
│ ├── skeletons/
│ ├── dense/
│ └── ...
├── src/
│ ├── inference.py
│ ├── utils/
│ │ └── val_metrics.py
│ ├── environment.yml
│ ├── hubconf.py
│ └── ...
├── .gitignore
├── LICENSE
├── README.md
└── ...
assets/
:存放项目相关的资源文件。data/
:包含数据集文件夹,其中包括图片、关键点、标签图、骨架和密集点等数据。src/
:源代码文件夹,包含推理脚本、工具函数、环境配置和模型配置等。.gitignore
:指定Git应该忽略的文件和目录。LICENSE
:项目的许可文件。README.md
:项目的说明文件。
2. 项目的启动文件介绍
项目的启动主要依赖于src/inference.py
文件。该脚本用于执行模型的推理过程,其基本使用方法如下:
python src/inference.py --dataset [dresscode|vitonhd] --dresscode_dataroot <path> --vitonhd_dataroot <path> --output_dir <path> --test_order [paired|unpaired] --category [all|lower_body|upper_body|dresses] --mixed_precision [no|fp16|bf16] --enable_xformers_memory_efficient_attention --use_png --compute_metrics
该脚本接受多个参数,包括数据集类型、数据集路径、输出目录、测试模式、测试类别、混合精度设置、是否启用内存高效的注意力机制、是否使用PNG格式图片和是否计算指标等。
3. 项目的配置文件介绍
项目的主要配置文件是src/environment.yml
,该文件用于定义项目运行所需的Python环境和依赖库。使用conda
环境管理器时,可以通过以下命令创建和激活环境:
conda env create -n ladi-vton -f environment.yml
conda activate ladi-vton
如果需要手动创建环境并安装依赖,可以使用以下命令:
conda create -n ladi-vton -y python=3.10
conda activate ladi-vton
pip install torch==2.0.1 torchvision==0.15.2 opencv-python==4.7.0.72 diffusers==0.14.0 transformers==4.27.3 accelerate==0.18.0 clean-fid==0.1.35 torchmetrics[image]==0.11.4 wandb==0.14.0 matplotlib==3.7.1 tqdm xformers
确保所有依赖安装完成后,项目才能正常运行。