极简笔记语义分割中的self-attention变种模型

最新推荐文章于 2024-05-31 09:40:38 发布

Hibercraft

最新推荐文章于 2024-05-31 09:40:38 发布

阅读量2k

点赞数

分类专栏：极简笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Hibercraft/article/details/100174316

版权

本文是一篇关于语义分割中self-attention变种模型的极简笔记，探讨了PSANet、OCNet、CCNet、DANet、ACPNet和CFNet等模型的改进和特点。各模型通过不同方式优化了相似性计算，减少了计算量，提升了语义分割性能。

摘要由CSDN通过智能技术生成

极简笔记语义分割中的self-attention变种模型

Self-attention模块在近年来取得了比较不错的成功，其核心公式就是：
$y_i=\frac{1}{\mathcal{C}(x)}\sum_{\forall j}f(x_i,x_j)g(x_j)$
与以往的卷积网络项目，self-attention module的核心在于计算了全图特征的相似性 $f(x_i,x_j)$ (当然这个相似性计算方式可以自己各种定义啦)，然后将全图的特征 $g(x_j)$ 按照相似性进行聚合得到当前位置 $i$ 的聚合后的特征。

这样一个模块可以直接套在任何网络上，当然也包括所有semantic segmentation模型。但是只加这么一点肯定还不够发文章，于是各种针对公式和模块结构的魔改就开始了：

PSANet

https://hszhao.github.io/papers/eccv18_psanet.pdf
原公式的相似性是一个双向的相似性计算，将 $f(x_i,x_j)$

最低0.47元/天解锁文章

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
极简笔记语义分割中的self-attention变种模型

极简笔记语义分割中的self-attention变种模型Self-attention模块在近年来取得了比较不错的成功，其核心公式就是：yi=1C(x)∑∀jf(xi,xj)g(xj)y_i=\frac{1}{\mathcal{C}(x)}\sum_{\forall j}f(x_i,x_j)g(x_j)yi=C(x)1∀j∑f(xi,xj)g(xj)与以往的卷积网络项目，self...
复制链接

扫一扫

专栏目录

Hibercraft CSDN认证博客专家 CSDN认证企业博客

码龄7年

38: 原创

9万+: 周排名

226万+: 总排名

13万+: 访问

: 等级

1686: 积分

77: 粉丝

40: 获赞

22: 评论

160: 收藏

私信

关注

热门文章

分类专栏

极简笔记 37篇

最新评论

极简笔记 The Lovasz-Softmax loss: A tractable surrogate for the optimization of the intersection-over-un
溯水襄陵_: 不懂这个loss到底是啥意思，不过代码写得还挺清楚，能直接用
极简笔记 Meta-Learning for semi-supervised few-shot classification
weixin_42720165: 你好，我想问一下，对于soft k-means + cluster的方法，对于所有的未标记样本，是直接把它归到N+1类中吗？
【极简笔记】Tunneling Neural Perception and Logic Reasoning through Abductive Learning
麦香猪扒饭: 您好，我想请教一个事情。当传入的数据是一致的时候，他会推导出算术规则如何加入KB中参与下一次的consistency判断吗？比如我识别出1+1=1，一致，那么abductive会推导出op(1, 1, 1)，这个op(1,1,1)会加入KB中并参与下一次consistency的判断吗？我觉得他是有加进去的，因为他的prolog里面是不包含operation rules的。但是如果是加进去了，如果是错误的怎么办，比如1111111可以识别成11+11=11，也可以识别成111+1=11，那么问题来了，当我识别成11+11=11是错误的，但是又满足一致性，于是我有operation rules op(11,11,11)，那如果是这样他又要怎么调整？我觉得他这个有点不太对劲。求解答，谢谢楼主了
极简笔记 Meta-Learning for semi-supervised few-shot classification
jinghanSun: 感谢分享！作者在实验部分给出了5-shot和20-shot的结果，作者说如果是5-way 5-shot的话只需要25个label，这是为什么啊？如果一个类别里有5张图片，那么就需要这五张图片的label啊，如果有很多个task，那么就需要n_task*25个label啊
极简笔记 Pyramid Attention Network for Semantic Segmentation
qq_40548768: 楼主，请问这种前后不一致的现象（论文和开源的代码不一致），我该相信那个，两种实验的结果都不太好

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。