遥感影像识别-多类识别下的错分问题

122&&113

已于 2022-02-11 13:02:42 修改

阅读量2.7k

点赞数

分类专栏：深度学习文章标签：深度学习 cnn

于 2022-02-10 16:33:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Z_122113/article/details/122808476

版权

深度学习专栏收录该内容

9 篇文章

订阅专栏

本文详述了在遥感影像识别中，利用深度学习模型进行训练的过程，包括数据预处理（如图像裁剪和数据增强），以及由此导致的模型将绿地误判为水域的问题。分析了问题产生的原因，主要是水域与绿地颜色和形状的相似性，以及数据集中绿地标注的缺失。提出了改进思路，包括考虑使用更多样化的数据集和分开训练水域与绿地的模型，以提高识别准确性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

前情提要

紧接前文：
遥感影像识别-利用较大数据集训练
通过上次制作的数据集进行训练，最终得到拟合的深度学习模型，接下来分析出现的问题以及解决的想法。

1. 训练前的准备(补充)

由于前一篇文章并未指出数据集的使用方式导致数据集被误认为较小，因此准备画图以及说明来补一下前面留的坑。

1.1 数据预处理

由于原始数据集分辨率都是比较大的，而且每张图像的分辨率大小都不相同，因此是无法直接放到模型中训练的，原因有二：一是分辨率过大，显存会爆；二是训练需要的数据大小需要统一。为此对数据做下图的操作。
在这里插入图片描述
这是局部的一个处理过程，其实和深度学习中的卷积核滑动窗口去计算相似，也是滑动裁取图像。下图是全局的，看着可能就比较直接。

数据集大小变化结果：
$30\to3740\to7480$
这里的 $\to 7480$ 是将裁切图像通过数据增强又增加了一倍的数据。

图像分辨率可表示为：
$\mathrm{W} \times \mathrm{H} \sim 2560\times1440$
分辨率大小变化结果：
$\mathrm{W} =\{1004,\dots,15088\}\rightarrow \mathrm{W} =\{512\} \\ \mathrm{H} =\{751,\dots,8017\}\rightarrow \mathrm{H} =\{512\}$

以上便是数据准备的工作。

2. 训练后的效果

最后一张是利用现在的数据来跑的，前一张则是之前用了五张大图像来跑的。
在这里插入图片描述
评价指标：

3. 出现的问题

在这里插入图片描述
从上图可以看出，模型将地图中的绿地部分预测成了水域。

3.1 原因

在这里插入图片描述

水域与绿地的颜色是比较相近的，从分布的形状来说也比较相近，且数据集中由于都是从城市地区采集的，因此水域都呈青绿色，与绿地相近
由于电子地图中对于绿地的标注几乎没有，因此在开始的训练中并未将绿地这一类加入到模型中识别，也是导致模型分不清绿地与水域

3.2 思考

对于上述原因，主要有几个看法

最开始是围绕电子地图这一主题去制作数据集，然后再训练预测，但是这样的方法是比较有局限性的，标注的质量完全取决于电子地图，且类别也由它来决定，因此模型跑出来的效果不太理想。
如果只追求效果，那么可能还有一种方式，就是去利用现有的不同类别的数据集去训练不同的模型，最后再将结果集成到一起。

4. 分开识别

现在尝试将水域和绿地单独用一个模型去训练识别，最后将结果与另一个模型做集成，目前才把数据集给做了出来，然后投入训练。
在这里插入图片描述

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。