Vision Transformer多波段影像分类

最新推荐文章于 2023-08-22 09:52:15 发布

犟果

最新推荐文章于 2023-08-22 09:52:15 发布

阅读量502

点赞数

文章标签： transformer pytorch python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014248147/article/details/122045283

版权

计算机视觉总用三波段RGB影像做分类，代码也是三波段影像作为输入做的。

对多波段影像处理需要做一些代码改进。其实也不难，pytorch包兼容性很高，所以只是对自编代码修改就可以解决问题。

这次改的是vision transformer的官方代码，就是论文里附的代码GitHub - google-research/vision_transformer

将三波段改为四波段，也会备注n波段怎么改。首先做的就是现有四波段影像，替换路径直接运行，依次会遇到三个BUG，一个个修就好，其实没有很难：

1
UnidentifiedImageError: cannot identify image file

有文章说PIL图像库不支持的16位图像（uint16）。本以为需要将tif转为png，拉伸到0-255，但其实发现PIL只是不支持16位TIF影像，直接将16位TIF转为16位png就可以了。

2
The size of tensor a (4) must match the size of tensor b (3) at non-singleton dimension 0:

修改augdata.py:

transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])

=>
transforms.Normalize([0.5, 0.5, 0.5, 0.5], [0.5, 0.5, 0.5, 0.5])

这个是在归一化的时候，三波段均值和标准差矩阵需要三个变量，四波段就是四个，n波段就是需要n个0.5。

3
RuntimeError: Given groups=1, weight of size [768, 3, 16, 16], expected input[32, 4, 224, 224] to have 3 channels, but got 4 channels instead

model.py:

self.embedding = nn.Conv2d(3, emb_dim, kernel_size=(fh, fw), stride=(fh, fw))

=>
self.embedding = nn.Conv2d(4, emb_dim, kernel_size=(fh, fw), stride=(fh, fw))

这是embedding切图像的时候维度修改，n波段就把第一个参数改为n。

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

犟果 CSDN认证博客专家 CSDN认证企业博客

码龄11年

28: 原创

9万+: 周排名

119万+: 总排名

12万+: 访问

: 等级

1288: 积分

81: 粉丝

127: 获赞

64: 评论

188: 收藏

私信

关注

热门文章

最新评论

eCognition SVM 分层分类心得
2201_75315570: 您好，我是直接分割完选的样本，就直接用 classifer 中的 SVM 分类器分，但是显示he future couldn't be evaluated 报错，请问怎么解决呀？急急急急急！！！
eCognition SVM 分层分类心得
普通网友: 那个demo在哪里呢，我找不动到呢
c#CheckedListBox单选多选个数限制问题
sunny~晴: 大佬帮我看看改成这样行不行 if (e.Equals(CheckState.Checked)) return;//取消选中就不用进行以下操作 for (int i = 0; i < ((CheckedListBox)sender).Items.Count; i++) { ((CheckedListBox)sender).SetItemChecked(i, false);//将所有选项设为不选中 } checkedListBox1.Refresh();
c#CheckedListBox单选多选个数限制问题
sunny~晴: 为啥我抄代码 CurrentValue会报 CS1061 “type”未包含“name”的定义，并且找不到可接受第一个“type”类型参数的可访问扩展方法“name”（是否缺少 using 指令或程序集引用？） QAQ 我啥也没改只是添加了几个选项
eCognition基础操作
酸酸的剁椒酱: 请问export vector layer算法是在父节点下面新建一个新的子节点然后运行吗

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。