VIT
文章平均质量分 75
烟雨行舟#
这个作者很懒,什么都没留下…
展开
-
TransReID学习记录
提出了一个纯粹基于变压器的对象ReID框架,名为TransReID。具体来说,我们首先将图像编码为补丁序列,并通过一些关键改进构建基于变压器的强基线,这在基于cnn的方法的几个ReID基准上取得了具有竞争力的结果。为了进一步增强变压器背景下的鲁棒特征学习,精心设计了两个新的模块。(i)提出了拼图补丁模块(jigsaw patch module, JPM),通过移位和补丁洗牌操作重新排列补丁嵌入,生成鲁棒特征,提高了识别能力和覆盖范围的多样性。(ii)引入边信息嵌入(SIE),...原创 2022-08-27 20:48:08 · 4195 阅读 · 5 评论 -
VIT学习笔记
受到NLP领域中Transformer成功应用的启发,ViT算法中尝试将标准的Transformer结构直接应用于图像,并对整个图像分类流程进行最少的修改。具体来讲,ViT算法中,会将整幅图像拆分成小图像块,然后把这些小图像块的线性嵌入序列作为Transformer的输入送入网络,然后使用监督学习的方式进行图像分类的训练。之前的算法大都是保持CNN整体结构不变,在CNN中增加attention模块或者使用attention模块替换CNN中的某些部分。本文仅供学习参考使用,不做任何经济活动,侵权删除。...原创 2022-08-27 15:12:52 · 796 阅读 · 1 评论