Vit一样的结构,现在不需要额外的数据训练了,用数据增强以及CNN作为老师蒸馏。
深度学习Transformer(五)——Deit Training data efficient image transformers & distilation through attention
最新推荐文章于 2024-02-28 15:02:21 发布
Vit一样的结构,现在不需要额外的数据训练了,用数据增强以及CNN作为老师蒸馏。