使用stable diffusion进行数据扩充

chan_blue

已于 2024-06-18 09:45:05 修改

阅读量815

点赞数 6

分类专栏：数据生成文章标签： stable diffusion

于 2024-06-18 09:40:36 首次发布

本文链接：https://blog.csdn.net/weixin_42741178/article/details/139760925

版权

2 篇文章

订阅专栏

做reid任务会遇到些难样本，希望对这些难样本进行数据扩充，加入网络，提高模型对这几个类别的识别效果。

光用prompt生成的图像与真实样本差距过大，因此希望采用图像+文字引导生成图像。（也试过GAN，无法满足特定视角图像效果）因此。尝试大名鼎鼎的Stable Diffusion的图生图模式。目前搜索了一下还没有相关的blog，在此把遇到的问题和调试步骤都记录一下，以便有需要的同好查看。
code

cd /your_project/stable-diffusion
pip install transformers==4.19.2 diffusers invisible-watermark
pip install -e .

如果遇到no module named taming的问题，可根据这个回答的方法二解决。
no module named taming

python scripts/img2img.py --prompt "A fantasy landscape, trending on artstation" --init-img <path-to-img.jpg> --strength 0.8

这里的prompt确实对生成图像的影响较大，建议采用比较简单的prompt，太细节了生成图像反而比较假。这里的strength指的是加入到输入图像中的噪声量，可以根据官网下的示例选择这个strength。

在这里插入图片描述

stable diffusion确实好强大，细节生成的不错，但是还是没办法控制生成的图像背景和其他信息，因此还需要手动删除些不符合所需数据分布的图片。