[论文阅读] Maskfomer

最新推荐文章于 2024-02-04 23:42:32 发布

weixin_51058694

最新推荐文章于 2024-02-04 23:42:32 发布

阅读量103

点赞数 1

文章标签：论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_51058694/article/details/134327662

版权

MaskFormer

Mask classification formulation

用mask classfication的方法

step1: 把图像分为K个区域（k不一定需要等于类别数），这个region可以用mask（取值0-1）来表示。被遮住的不算这个区域内，没有被遮住的图像部分就是这个region

step2：将每个区域作为一个整体与 K +1个类别上的某种分布相关联（其实就是softmax求概率），K+1是为了添加一个no-object类，表示某个region不属于class中的任何一类

step3：定义出gd类（根据gd得出的，mask and label）

然后我们的目标就是把output

跟gd Z做出一一对应，表示属于某个类以及其mask，然后最小化这个损失

loss函数：由两部分组成 1是cls loss 2是这一类的mask的loss

MaskFormer

模型显著性的分成了3部分：

pixel module

简单的downsampling，用backbone提特得特征图

transformer module

从feature 和 query（N个可学习的位置EMB）来获取最后的输出Q

Q的维度是CQ* N ， N是query的数目，CQ是特征维度，也就是所谓的global infor about each segment Maskformer predict

seg module

从transformer decoder出来之后，我们可以视Q为集合了很多特征的结果（类似于卷积里的特征图，有了特征图就能对其进行GAP然后预测什么的）

第一个操作就是过一个linear，然后接一个softmax做类别预测

这个网络用cls loss去约束

第二个操作是过一个2个隐藏层的mlp，然后把特征转换为mask的特征（CQ->CE）

通过和upsamping出来的特征做内积，用sigmoid激活，得到一个N H W的mask预测（N是region数，HW是高宽），用binary mask loss去约束

这个2维和3维在通道数上相乘可以视为通道融合（1*1卷积）

Infer（）

没有gd了现在，挑最大的

经过两个linear，我现在得到了

cls N * (K+1)

mask N H W

这样我就得到我理想的output Z （pi ， mi）（i=1，2，....，N）

现在我们要做的就是，把每一个点分进某个Z里面，然后这个Z的类别就是argmax Pi

General infer

取每一个Z中 argmax P的 label Cj scorei = Pi（cj）* mi【h,w】 (pixel level)

然后我有N个Z，我取其中的score max的pair i，把这个像素点分到这个（pair）中，这个pair的类别（cls）就是argmax pi对应的 label

Semantic infer

weixin_51058694

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

weixin_51058694 CSDN认证博客专家 CSDN认证企业博客

码龄4年

4: 原创

128万+: 周排名

152万+: 总排名

1678: 访问

: 等级

48: 积分

0: 粉丝

3: 获赞

3: 评论

4: 收藏

私信

关注

热门文章

最新评论

[论文阅读] Maskfomer
CSDN-Ada助手: 恭喜你撰写了关于"Maskfomer"的论文阅读博客！阅读论文并分享自己的见解是一个很好的学习和分享经验的方式。我真的很高兴看到你持续创作，为我们带来了新的见解。对于下一步的创作建议，我谨提几点意见。首先，你可以尝试更深入地探索"Maskfomer"这个主题，深入理解其背后的原理和应用场景。其次，你可以考虑与其他相关领域进行交叉，探索"Maskfomer"与其他技术或方法的结合，以便进一步拓宽视野和开拓新的研究方向。最后，建议你在博客中加入更多实际案例或实验结果，以加强你的论点和论文阅读的可信度。我非常期待你的下一篇博客，并期望看到你在这个领域的不断成长和进步。谢谢你的分享，让我们一起继续探索和学习！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
[论文阅读-WSSS]Affinity Net
CSDN-Ada助手: 非常棒的博客！你的论文阅读真的很令人钦佩。通过affinity net生成更优质的特征图，这是一个非常有趣的研究方向。你在博文中提到了使用相似性矩阵进行random-walk，这是一个非常巧妙的方法。除此之外，你可以考虑在博文中扩展一些相关的知识和技能，例如深入探讨CAM的优化方法，或者介绍一些其他的特征图生成网络。继续努力写作，期待看到更多精彩的内容！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。