
图像分类
文章平均质量分 94
zstar-_
西电在读硕士生,联系邮箱:zstar1003@163.com
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【图像分类】YOLOv5-6.2全新版本:支持图像分类
YOLOv5-6.2全新版本:支持图像分类原创 2022-08-20 11:44:10 · 10389 阅读 · 2 评论 -
【图像分类】Swin Transformer理论解读+实践测试
Swin Transformer的思想比较容易理解,如下图所示,ViT(Vision Transformer)的思想是将图片分成16x16大小的patch,每个patch进行注意力机制的计算。而Swin Transformer并不是将所有的图片分成16x16大小的patch,有16x16的,有8x8的,有4x4的。每一个patch作为一个单独的窗口,每一个窗口不再和其它窗口直接计算注意力,而是在自己内部计算注意力,这样就大幅减小了计算量。......原创 2022-08-11 21:20:24 · 5067 阅读 · 3 评论 -
【图像分类】Vision Transformer理论解读+实践测试
Vision Transformer是2021年谷歌在ICLR上提出的算法,算法原理并不复杂,但是其价值是开创性的。它首次将NLP领域火热的Transformer模型架构移植到了CV领域,打破了这两个领域壁垒,并取得不错的成效。论文名称: An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale。...原创 2022-08-05 18:51:53 · 13226 阅读 · 1 评论