Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion

828 篇文章 3 订阅

已下架不支持订阅

12 篇文章 0 订阅
本文提出DiffSeg,一种利用稳定扩散模型进行无监督零样本图像分割的方法。通过注意力图的迭代合并,实现高质量分割,无需任何训练或语言依赖。在COCO-Stuff-27上,DiffSeg在像素精度和平均IoU上显著优于现有无监督零样本SOTA技术。
摘要由CSDN通过智能技术生成

本文是LLM系列文章,针对《Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion》的翻译。

扩散、关注和分割:使用StableLM diffusion的无监督零样本分割

摘要

生成高质量的图像分割掩模是计算机视觉中的一个基本问题。最近的研究已经探索了大规模的监督训练,以实现对几乎任何图像风格的零样本分割,以及无监督训练,以便在没有密集注释的情况下实现分割。然而,构建一个能够在没有任何注释的情况下以零样本方式分割任何东西的模型仍然具有挑战性。在本文中,我们建议利用稳定扩散模型中的自注意层来实现这一目标,因为预先训练的稳定扩散模型已经学习了其注意层中对象的固有概念。具体来说,我们引入了一种简单而有效的迭代合并过程,该过程基于测量注意力图之间的KL散度,将它们合并为有效的分割掩码。所提出的方法不需要任何训练或语言依赖性来提取任何图像的质量分割。在COCO-Stuff-27上,我们的方法在像素精度和平均IoU上分别超过了先前的无监督零样本SOTA方法26%和17%。

1 引言

2 相关工作

3 方法

4 实验

5 可视化

6 结论

无监督和

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值