论文解析|Bottleneck Transformers for Visual Recognition
最新推荐文章于 2022-06-27 21:13:36 发布
本文探讨了Bottleneck Transformers(BoTNet)在视觉识别中的应用,这是一种结合了自注意力机制的新backbone。BoTNet在ImageNet上达到84.7%的精度,超越SENet和EfficientNet,并在目标检测和实例分割任务中表现出显著提升。通过替换ResNet中的3x3卷积为Multi-Head Self-Attention,BoTNet展示了其效能,且代码即将开源。
摘要由CSDN通过智能技术生成