LIVE 预告 | 华为诺亚韩凯:Transformer in Transformer

华为诺亚方舟实验室的高级研究员韩凯提出Transformer in Transformer(TNT)架构,这是一种结合局部和全局特征的视觉Transformer网络,超越了ViT和DeiT。TNT在ImageNet上的Top-1准确率达到了81.3%,并在计算机视觉领域展现出潜力。
摘要由CSDN通过智能技术生成

近期,华为诺亚方舟实验室的研究者提出了一种新型视觉Transformer网络架构,Transformer in Transformer,性能表现优于谷歌的 ViT 和 Facebook 的DeiT。该网络中的TNT模块,通过内外两个Transformer 联合提取图像局部和全局的特征。

Transformer in Transformer 架构

具体而言,新提出的 TNT block 使用一个外 Transformer block 来对 patch 之间的关系进行建模,用一个内 Transformer block 来对像素之间的关系进行建模。通过 TNT 结构,研究者既保留了 patch 层面的信息提取,又做到了像素层面的信息提取,从而能够显著提升模型对局部结构的建模能力,提升模型的识别效果。该网络在ImageNet 图像识别任务上,Top-1正确率达到81.3%。

智源社区特邀请论文《Transformer in Transformer》一作华为诺亚方舟实验室高级研究员韩凯就其研究过程及内容做报告分享,欢迎大家参与交流讨论。

报告主题:Transformer in Transformer

报告时间:2021年3月

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值