Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion

最新推荐文章于 2024-10-07 06:31:57 发布

UnknownBody

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量267

点赞数

分类专栏：深度学习文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/132581794

版权

LLM 日更同时被 2 个专栏收录

828 篇文章 3 订阅

已下架不支持订阅

12 篇文章 0 订阅

订阅专栏

本文提出DiffSeg，一种利用稳定扩散模型进行无监督零样本图像分割的方法。通过注意力图的迭代合并，实现高质量分割，无需任何训练或语言依赖。在COCO-Stuff-27上，DiffSeg在像素精度和平均IoU上显著优于现有无监督零样本SOTA技术。

摘要由CSDN通过智能技术生成

本文是LLM系列文章，针对《Diffuse, Attend, and Segment: Unsupervised Zero-Shot Segmentation using Stable Diffusion》的翻译。

扩散、关注和分割：使用StableLM diffusion的无监督零样本分割

摘要
1 引言
2 相关工作
3 方法
4 实验
5 可视化
6 结论

摘要

生成高质量的图像分割掩模是计算机视觉中的一个基本问题。最近的研究已经探索了大规模的监督训练，以实现对几乎任何图像风格的零样本分割，以及无监督训练，以便在没有密集注释的情况下实现分割。然而，构建一个能够在没有任何注释的情况下以零样本方式分割任何东西的模型仍然具有挑战性。在本文中，我们建议利用稳定扩散模型中的自注意层来实现这一目标，因为预先训练的稳定扩散模型已经学习了其注意层中对象的固有概念。具体来说，我们引入了一种简单而有效的迭代合并过程，该过程基于测量注意力图之间的KL散度，将它们合并为有效的分割掩码。所提出的方法不需要任何训练或语言依赖性来提取任何图像的质量分割。在COCO-Stuff-27上，我们的方法在像素精度和平均IoU上分别超过了先前的无监督零样本SOTA方法26%和17%。

1 引言

2 相关工作

3 方法

4 实验

5 可视化

6 结论

无监督和

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

已下架不支持订阅

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。