基于深度学习的整景遥感影像语义分割推理方法Python+Torch
一、遥感影像推理时的两个问题
1.1、影像过大
随着分辨率的提高,整景遥感影像存储量也变大。由于计算机性能的限制(内存与GPU显存),在使用深度学习模型进行推理预测时,模型无法一次读入,需要分块将数据读入内存处理。
2.1、分块导致缝隙
将分块的数据输入模型进行推理后,相邻区块得到的结果直接拼接后会出现缝隙,一个原因是模型的精度不够高,另一个原因是池化层在处理边界像素时,会进行补0操作,模型的卷积层越多,补0操作越多,会导致边界预测不准。
二、叠加窗口
2.1、读取数据
每次从大图像中读取一定窗口(512x512)大小的数据,依次水平滑动窗口读取数据,相邻窗口之间有一定的重叠度(256)。
2.2、写入推理结果
写入推理结果时,由于相邻两块之间有重叠,重叠部分选择哪个区块推理的结果是个问题,这里我们考虑池化的补0操作会导致边界预测精度较低的情况,以左右相邻两个区块为例,将重叠区域从中间二等分,左侧区域使用左边区块预测的结果,右