- 博客(2)
- 收藏
- 关注
原创 CVPR‘2024 即插即用系列! | StructViT:结构化视觉Transformer
本文引入了一种新的自注意机制,StructSA,它利用查询键相关的丰富结构模式进行视觉表征学习。StructSA利用局部关联的空间(和时间)结构,并在整个位置上聚合局部特征块。结构视觉转换器(StructViT)使用StructSA作为主要注意力模块,在图像和视频分类基准上实现了最先进的结果。希望看完的小伙伴多多,我会持续分享深度学习领域最新的论文!
2024-06-19 17:37:42 1623
原创 目前最强的语言模型!一文看懂Mamba到底对Transformer和RNN做了什么升级!
把Transformer,RNN都视为一种SSM模型,简明的介绍了Mamba到底做了什么。
2024-05-03 14:44:10 1553 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人