利用文本描述替换万物(Inpaint-Anything-Description)

文章目录


github: https://github.com/Atlas-wuu/Inpaint-Anything-Description

引言

前段时间看了万物分割SAM、文生图Stable Diffusion、开集检测Grounding DINO,它们之间可以互相补充,AIGC变得更加可控。Inpaint Anything将SAM与Stabel Diffusion结合,通过人工选择目标point的方式进行目标替换。
通过人工选择point交互,生成效率比较低,因此假期开发了Inpaint-Anything-Description,通过输入原始图片、图中需要替换的目标文本描述及替换后目标的文本描述即可。

安装

  1. 通过conda创建python>=3.8的虚拟环境
    conda create -n inpaint python=3.8
    conda activate inpaint
  2. 从GitHub clone代码
    git clone https://github.com/Atlas-wuu/Inpaint-Anything-Description.git
  3. 安装相关库
    安装 torch
    cd Inpaint-Anything-Description
    pip install torch torchvision torchaudio
    安装SAM
    pip install -e segment_anything
    安装Stable Diffusion
    pip install diffusers transformers accelerate scipy safetensors
    安装GroundingDINO
    cd GroundingDINO
    pip install -q -e .

Demo

src_prompt表示待替换目标描述;
dst_prompt表示替换后目标描述;

python fill_anything_str.py \
    --input_img ./example/fill-anything/sample1.png \
    --src_prompt "white dog"  \
    --dst_prompt "bear" \
    --dilate_kernel_size 50 \
    --output_dir ./results \
    --grounddino_model_type "swin_t" \
    --grounddino_ckpt ./pretrained_models/groundingdino_swint_ogc.pth \
    --sam_model_type "vit_h" \
    --sam_ckpt ./pretrained_models/sam_vit_h_4b8939.pth

下图为原图中白色狗替换为熊,
–src_prompt “white dog”
–dst_prompt “bear”

图1 原图
图2 白色狗
图3 熊

下图为原图中公交车替换为骑车的人,
–src_prompt “bus”
–dst_prompt “a man riding bike”

图1 原图
图2 公交车
图3 骑车的人

👉👉👉如果觉得不错,感谢关注与🌟!

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值