怎样制作目标检测的训练样本图像（医疗图像、遥感图像、大图像裁剪）

最新推荐文章于 2023-03-18 13:43:47 发布

置顶

MrSpart

最新推荐文章于 2023-03-18 13:43:47 发布

阅读量4.6k

点赞数 6

文章标签：深度学习计算机视觉人工智能卷积神经网络

本文链接：https://blog.csdn.net/MrSpart/article/details/116137943

版权

本文可以随意转载，但是请保留内容完整，并保留原文链接

像元值应该如何进行归一化？

不能想当然地认为像元值的取值范围就是0到255，虽然普通数码相机拍摄出来的图像各个通道的取值范围确实是0-255。要知道这个0-255的取值是从更大取值范围处理得来的。在局部强烈光照下或者均匀光照下，还是弱光环境或者强光环境，人眼能够感受到相同的颜色，但是数码相机的传感器会量化出不同的像元值。RGB的取值对应了固定的颜色，不同环境下传感器会量化出的像元值要怎么才能映射为一致的颜色？这个技术就叫做宽动态。为了宽动态处理结果更细腻，传感器的量化范围通过更大。如下图，左侧是关闭了宽动态的效果，在这个图上要想把手机检测出来几乎是不可能的。

在这里插入图片描述
由于数码相机做过了宽动态处理，对普通数码照片进行归一化，可以简单的将0-255线性映射到0-1。而医学图像、遥感图像则不能简单的利用最小最大像元值归一化到0-1。由于白噪声的存在，医学图像、遥感图像的直方图通常如下图所示（横轴代表像元值范围，红色纵轴表示归一化后的取值，绿色纵轴表示不同像元值的像素频数，绿色曲线就是直方图）。

直方图和归一化映射
如果按照红色实线代表的归一化映射进行处理，最终绝大多少像素取值集中在0附近，整幅图像一片黑（翻转后的绿色虚曲线就是归一化后的直方图。最佳的处理方式是按照红色长线段虚线代表的映射进行归一化，但是这个映射难以求解，一般按照红色点虚线代表的映射进行处理就行。

红色点虚线代表的映射其实挺简单的，选取合适的最小最大值，小于最小值的置为0，大于最大值的置为1，中间的线性映射。最大最小值的选取方法有均值±x*标准差和排除两端一定占比的像素。排除两端一定占比的像素的示意图如下，从两端按照百分比排除像素时就能够选取新的最小最大值，此时的归一化映射图像为红色点虚线。

排除两端一定占比的像素

样本图像的尺寸仅与内存、显存大小有关吗？

如果栅格的边长减去1后不能被stride整除，卷积的降采样过程会丢弃边缘的像素，结果是特征图像素与输入图像位置映射会产生偏移。最终的特征图是不能完整映射到输入图像范围的，拿一个错位的特征图像素去预测原图上的目标，想想都不靠谱。目前所有的深度学习框架都没有考虑这里的映射错位关系，就算用Mask-RCNN提供的ROIAlign也是错位的。

不能被stride整分导致的错位
所以

最低0.47元/天解锁文章

MrSpart

关注

6
点赞
踩
58

收藏

觉得还不错? 一键收藏
1
评论
怎样制作目标检测的训练样本图像（医疗图像、遥感图像、大图像裁剪）

像元值应该如何进行归一化？不能想当然地认为像元值的取值范围就是0到255，虽然普通数码相机拍摄出来的图像各个通道的取值范围确实是0-255。要知道这个0-255的取值是从更大取值范围处理得来的。在局部强烈光照下或者均匀光照下，还是弱光环境或者强光环境，人眼能够感受到相同的颜色，但是数码相机的传感器会量化出不同的像元值。RGB的取值对应了固定的颜色，不同环境下传感器会量化出的像元值要怎么才能映射为一致的颜色？这个技术就叫做宽动态。为了宽动态处理结果更细腻，传感器的量化范围通过更大。如下图，左侧是关闭了宽动态
复制链接

扫一扫