论文笔记--TransFG

最新推荐文章于 2024-04-27 09:46:04 发布

未来可期的

最新推荐文章于 2024-04-27 09:46:04 发布

阅读量566

点赞数

文章标签：论文阅读深度学习 Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45542288/article/details/128674287

版权

Paper: TransFG: A Transformer Architecture for Fine-Grained Recognition

文章链接：TransFG: A Transformer Architecture for Fine-Grained Recognition | Proceedings of the AAAI Conference on Artificial Intelligence

这是首个将Vision Transformer引入细粒度识别领域的模型。在ViT的基础上，针对细粒度识别任务，作者进行了一些改进。包括提出了一种适用于ViT的部件选择模块，帮助模型找到有辨识度的区域，去除冗余的信息；使用对比损失（Contrastive Loss）使模型更具辨识力。

上图为TransFG的网络结构图。TransFG的整体框架依赖于ViT。在ViT的基础上，作者做出了以下改动：（1）为了避免在划分patches时，对重要的有辨识度的区域进行了切分，采用滑动窗口的方式，进行重叠划分。这样能够保证任意小区域至少在一个patch内是完整的；（2）在最后一个Transformer Layer前，作者插入了一个部件选择模块。该模块对输入的tokens，只保留激活程度较高的tokens，视作更具辨识度的部分，和class token拼接后，输入到最后的Transformer Layer层。（3）在原有的交叉熵损失的基础上，作者还根据增加计算对比损失，来让模型更好地学到细微的差异。对比损失的作用，是根据每个batch内的训练样本，尽可能让同类别的相似度更大，不同类别的相似度更小。

在实验中，在ViT-B_16的主干网络下，这些改进在CUB-200-2011数据集上提高了1.4%的准确率，达到了91.7%，证明了这些方法在细粒度数据集上的有效性。

未来可期的

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
论文笔记--TransFG

上图为TransFG的网络结构图。在ViT的基础上，作者做出了以下改动：（1）为了避免在划分patches时，对重要的有辨识度的区域进行了切分，采用滑动窗口的方式，进行重叠划分。该模块对输入的tokens，只保留激活程度较高的tokens，视作更具辨识度的部分，和class token拼接后，输入到最后的Transformer Layer层。在实验中，在ViT-B_16的主干网络下，这些改进在CUB-200-2011数据集上提高了1.4%的准确率，达到了91.7%，证明了这些方法在细粒度数据集上的有效性。
复制链接

扫一扫

未来可期的 CSDN认证博客专家 CSDN认证企业博客

码龄5年

60: 原创

110万+: 周排名

4万+: 总排名

4万+: 访问

: 等级

813: 积分

204: 粉丝

207: 获赞

7: 评论

468: 收藏

私信

关注

热门文章

最新评论

算法刷题记录 Day36
ha_lydms: 这个博客是我每天不可或缺的一部分，因为我觉得自己从中学到了很多宝贵的经验和智慧。
Anaconda 虚拟环境迁移（服务器 to 服务器）
gaohm_may: <<COMMENT # >>> conda initialize >>> # !! Contents within this block are managed by 'conda init' !! __conda_setup="$('/data/develop_soft/anaconda3/bin/conda' 'shell.bash' 'hook' 2> /dev/null)" if [ $? -eq 0 ]; then eval "$__conda_setup" else if [ -f "/data/develop_soft/anaconda3/etc/profile.d/conda.sh" ]; then . "/data/develop_soft/anaconda3/etc/profile.d/conda.sh" else export PATH="/data/develop_soft/anaconda3/bin:$PATH" fi fi unset __conda_setup # <<< conda initialize <<< COMMENT
论文笔记--PIM
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记--DCAL
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文笔记--TransFG
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

2024

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。