Task3学习笔记#DataWhale AI夏令营 第五期CV方向

上分思路--数据增强

Question:数据增强会产生新数据吗?

数据增强本身不会永久性地生成新的数据样本,而是动态地对现有数据进行变换。例如,每次从数据集中加载一个图像时,数据增强变换会随机应用到该图像上。这意味着在每个训练迭代中,同一个图像可能会以不同的变换形式出现,从而提高数据的多样性。

opencv中常用的数据增强技术:

1、旋转:将图像按指定角度旋转,这样模型可以学习到物体在不同方向上的特征。

angle = 45
M = cv2.getRotationMatrix2D(center, angle, scale)
rotated_image = cv2.warpAffine(image, M, (width, height))

2、缩放:通过缩放来改变图像的尺寸,允许模型识别不同大小的物体。

scaled_image = cv2.resize(image, None, fx=0.5, fy=0.5)

3、翻转:对图像进行水平翻转、垂直翻转或同时进行水平和垂直翻转,帮助模型适应不同视角。

flipped_image = cv2.flip(image, 1)  # 水平翻转

4、平移:将图像在水平或垂直方向上进行平移,让模型学会识别位移后的物体。

M = np.float32([[1, 0, tx], [0, 1, ty]])
translated_image = cv2.warpAffine(image, M, (width, height))

5、裁剪:从图像中随机裁剪出一个区域,用于训练模型,使模型能在部分可见的情况下识别物体。

cropped_image = image[y1:y2, x1:x2]

6、颜色抖动:改变图像的亮度、对比度、饱和度等,使得模型对颜色的变化更加鲁棒。

hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
hsv_image[:, :, 2] = hsv_image[:, :, 2] * 1.5  # 增加亮度
jittered_image = cv2.cvtColor(hsv_image, cv2.COLOR_HSV2BGR)

7、噪声:向图像中添加高斯噪声、椒盐噪声等,提升模型对噪声的抗扰能力。

noise = np.random.normal(0, 25, image.shape)
noisy_image = image + noise

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值