视觉Transformer研究的关键问题: 现状及展望

开饭啦。

已于 2022-06-16 09:03:01 修改

阅读量510

点赞数 1

分类专栏： Transformer 文章标签： transformer 计算机视觉综述文章视觉Transformer

于 2022-06-10 21:46:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43955917/article/details/125228584

版权

Transformer 专栏收录该内容

1 篇文章

订阅专栏

视觉Transformer研究的关键问题: 现状及展望

田永林, 王雨桐, 王建功, 王晓, 王飞跃. 视觉 Transformer 研究的关键问题: 现状及展望. 自动化学报, 2022, 48(4): 957-979

由于我们的疏忽，发表在自动化学报的版本中存在错误和疏漏，在此给出修正后的版本 (pdf地址)。感谢读者指出我们的问题！

摘要：Transformer 所具备的长距离建模能力和并行计算能力使其在自然语言处理领域取得了巨大成功并逐步拓展至计算机视觉等领域. 本文以分类任务为切入, 介绍了典型视觉 Transformer 的基本原理和结构, 并分析了 Transformer 与卷积神经网络在连接范围、权重动态性和位置表示能力三方面的区别与联系; 同时围绕计算代价、性能提升、训练优化以及结构设计四个方面总结了视觉 Transformer 研究中的关键问题以及研究进展; 并提出了视觉Transformer 的一般性框架; 然后针对检测和分割两个领域, 介绍了视觉 Transformer 在特征学习、结果产生和真值分配等方面给上层视觉模型设计带来的启发和改变; 并对视觉 Transformer 未来发展方向进行了展望.

关键字：视觉 Transformer, 图像分类, 目标检测, 图像分割, 计算机视觉
请添加图片描述

请添加图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。