深度学习两种图像数据预处理具体方法

最新推荐文章于 2024-05-19 20:41:42 发布

时光碎了天

最新推荐文章于 2024-05-19 20:41:42 发布

阅读量2.8k

点赞数 2

分类专栏：安装调试笔记

版权

17 篇文章 0 订阅

订阅专栏

输入图片 height, width

RESIZE_SIDE_MIN = 256

RESIZE_SIDE_MAX = 512

R_MEAN = 123.68G_MEAN = 116.78B_MEAN = 103.94

scale = width < height ? small_size / width : small_size / height 其中 small_size 为 RESIZE_SIDE_MIN 到 RESIZE_SIDE_MAX 的随机数
new_width = width * scale new_height = height * scale
用二分插值法将 (height, width) 转为 (new_height, new_width)
将 new_height, new_width 的图片 crop 为 crop_height(224), crop_width(224) 其中必须满足 new_height >= crop_height, new_width >= crop_width
将图片左右翻转（50% 的概率会翻转）
RGB 分别减去其平均值，其中依次为 R_MEAN, G_MEAN B_MEAN

用二分插值法将 (height, width) 转为 (new_height, new_width) 其中 new_height = new_width = 256
从 crop 中心的 crop_height, crop_width
RGB 分别减去其平均值，其中依次为 R_MEAN, G_MEAN B_MEAN

采用上述预处理方法的模型

对图片进行随机 crop, 使其与 bbox 的重叠部分大于 0.1，长宽比在 (0.75, 1.33) 之间，croped 之后的图片大小为原图的(0.05, 1.0)。
将 crop 之后的图片大小 resize 为 crop_height(224), crop_width(224)
将 crop 图片左右翻转（50% 的概率会翻转）
调整 crop 图片的亮度(32. / 255.)和饱和度(0.5, 1.5)
每个元素减去 0.5，再乘以 2.0

采用上述预处理方法的模型

关注

专栏目录