PaddleSeg 数据增强

最新推荐文章于 2024-07-10 21:30:00 发布

我是天才很好

最新推荐文章于 2024-07-10 21:30:00 发布

阅读量2.4k

点赞数

分类专栏： # 目标分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43593330/article/details/106278175

版权

目标分割专栏收录该内容

14 篇文章 4 订阅

订阅专栏

数据增强基本流程

在这里插入图片描述

Resize

Resize步骤是指将输入图像按照某种规则将图片重新缩放到某一个尺寸，PaddleSeg支持以下3种resize方式:
在这里插入图片描述

Unpadding 将输入图像直接resize到某一个固定大小下，送入到网络中间训练。预测时同样操作。
Step-Scaling 将输入图像按照某一个比例resize，这个比例以某一个步长在一定范围内随机变动。预测时不对输入图像做处理。
Range-Scaling 将输入图像按照长边变化进行resize，即图像长边对齐到某一长度，该长度在一定范围内随机变动，短边随同样的比例变化。预测时需要将长边对齐到另外指定的固定长度。

在这里插入图片描述

注：本文所有配置参数可在configs目录下您的yaml文件中进行设置。

图像翻转

PaddleSeg支持以下2种翻转方式：

左右翻转（Mirror）以50%概率对图像进行左右翻转。
上下翻转（Flip）以一定概率对图像进行上下翻转。

以上2种开关独立运作，可组合使用。故图像翻转一共有如下4种可能的情况：
在这里插入图片描述

Rich Crop

Rich Crop是PaddleSeg结合实际业务经验开放的一套数据增强策略，面向标注数据少，测试数据情况繁杂的分割业务场景使用的数据增强策略。流程如下图所示:
在这里插入图片描述
Rich Crop是指对图像进行多种变换，保证在训练过程中数据的丰富多样性，包含以下4种变换:

Blur 使用高斯模糊对图像进行平滑。
Rotation 图像旋转，旋转角度在一定范围内随机选取，旋转产生的多余的区域使用DATASET.PADDING_VALUE值进行填充。
Aspect 图像长宽比调整，从图像中按一定大小和宽高比裁取一定区域出来之后进行resize。
Color jitter 图像颜色抖动，共进行亮度、饱和度和对比度三种颜色属性的调节。

Random Crop

随机裁剪图片和标签图，该步骤主要是通过裁剪的方式使得输入到网络中的图像在某一个固定大小。

Random crop过程分为3种情形：

当输入图像尺寸等于CROP_SIZE时，返回原图。
当输入图像尺寸大于CROP_SIZE时，直接裁剪。
当输入图像尺寸小于CROP_SIZE时，分别使用DATASET.PADDING_VALUE值和DATASET.IGNORE_INDEX值对图像和标签图进行填充，再进行裁剪。

TRAIN_CROP_SIZE可以设置任意大小，具体如何设置根据数据集而定。

EVAL_CROP_SIZE的设置需要满足以下条件，共有3种情形：

当AUG.AUG_METHOD为unpadding时，EVAL_CROP_SIZE的宽高应不小于AUG.FIX_RESIZE_SIZE的宽高。
当AUG.AUG_METHOD为stepscaling时，EVAL_CROP_SIZE的宽高应不小于原图中最长的宽高。
当AUG.AUG_METHOD为rangescaling时，EVAL_CROP_SIZE的宽高应不小于缩放后图像中最长的宽高。

我是天才很好

关注

0
点赞
踩
15

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

我是天才很好 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。