【CVPR2024】扩散、关注、分割:使用稳定扩散进行无监督零样本分割

08624d0dc5f5bfaf4ce590dc380fe062.png

来源:专知
本文为论文介绍,建议阅读5分钟我们引入了一个简单而有效的基于测量KL散度的注意力图之间的迭代合并过程,以将它们合并成有效的分割掩码。

bb909ea7190781fa3f09f884dc3aeda0.png

在计算机视觉中,生成高质量的图像分割掩码是一个基本问题。最近的研究探索了大规模的监督训练,以实现几乎任何图像风格的零样本分割,以及无监督训练,以实现无需密集注释的分割。然而,构建一个能够在零样本情况下、无需任何注释即可分割任何对象的模型仍然充满挑战。在本文中,我们提议利用稳定扩散模型中的自监督学习层来实现这一目标,因为预训练的稳定扩散模型已经在其注意力层中学习了对象的内在概念。具体来说,我们引入了一个简单而有效的基于测量KL散度的注意力图之间的迭代合并过程,以将它们合并成有效的分割掩码。所提出的方法不需要任何训练或语言依赖,就可以为任何图像提取高质量的分割。在COCO-Stuff-27上,我们的方法在像素准确度上绝对超过了之前的无监督零样本SOTA方法26%,在平均IoU上超过了17%。项目页面位于https://sites.google.com/view/diffseg/home。

b00dc282006d7d745c5c16521764845b.png

12629e2c37c6849010b027d837a7464d.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值