昇思25天学习打卡营第十四天|Vision Transformer图像分类

       VIT模型是自然语言处理和计算机视觉两个领域的融合结晶,在不依赖卷积操作的情况下,依然可以在图像分类任务上达到很好的效果。

      VIT模型的主体结构是基于Transform模型的Encoder部分(部分结构顺序有调整)。

        环境准备与数据读取,开始实验之前,需要确保本地已经安装了Python环境并安装了MindSpore。请确保你的数据集路径如下结构。

68935e583ac64a9393c0b14b5f6d39a6.png

25286be8446542bea0a7679969f81b44.jpg 

 eb396a9289364c918f02bf7a114350ac.jpg

1c1c826bf0654ba78c4282b3a615f9db.jpg 

25aa7a98b9804248bee6e982440a0b70.jpg 

db8f128b6d244661b4e46a4002b39da6.jpg 

b1a4101ee5d3401aab09ed0e280458a0.jpg 

cc848bcfa68b46d4b4f26de8490d0c15.jpg 

43d8a03c38bb4a07b607c40b66bf05e0.jpg 

9eab7ebd936144478b116ab473f653c1.png 

a992bef86e414605824fc57287aeae67.png 

591a105c62e64c12a290ae94a5295e31.jpg 

77c8c8121ace4dec92cf858ef07b337a.png 

908a020d0c91463a808601bced0c6ebc.png 

2374c6207c9942639f81e55774599efc.jpg 

d2d2d180917e4cc5ba7793dcec2edcea.png 

b892abd28ddd449baa4cb79e47e97244.png 

f6645cc686c54c1cb45303643e467a1c.jpg 

e89e988a89404ea4b541e564f3c745dc.jpg 

5de43e94a07344f4b91810fe4e577671.png 

13db3c33d5e344dd8a2077a198b50d41.png 

8ef0146457c04bfdb0d8e5b4aac6cc64.jpg 

26476a510a644ae580ef16d794d32856.png 

4075cccd26db4698af8806f5057da14e.jpg 

 

  • 3
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值