数据增强的方法

最新推荐文章于 2024-02-15 12:28:54 发布

α木子

最新推荐文章于 2024-02-15 12:28:54 发布

阅读量640

点赞数

分类专栏：图像分割文章标签：人工智能机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_49496731/article/details/129177443

版权

图像分割专栏收录该内容

7 篇文章 0 订阅

订阅专栏

参考博主：https://blog.csdn.net/weixin_44211968/article/details/120995096

1.定义

数据增强是一种增加数据量的方法，将现有的数据通过一些方法进行扩充，从而生成更多有价值的数据。

2.单样本的数据增强

（1）几何变换类

几何变换类即对图像进行几何变换，包括翻转，旋转，移位，裁剪，变形，缩放等各类操作。

（2）颜色变换类

如果要改变图像本身的内容，就属于颜色变换类的数据增强了，常见的包括噪声、模糊、颜色变换、擦除、填充等等。

3.多样本的数据增强

（1）SMOTE

SMOTE即Synthetic Minority Over-sampling Technique（合成少数过采样技术），它是通过人工合成新样本来处理样本不平衡问题，从而提升分类器性能。

背景：类不平衡现象指的是数据集中各类别数量不近似相等。如果样本类别之间相差很大，会影响分类器的分类效果。假设小样本数据数量极少，如仅占总体的1%，则即使小样本被错误地全部识别为大样本，在经验风险最小化策略下的分类器识别准确率仍能达到99%，但由于没有学习到小样本的特征，实际分类效果就会很差。

SMOTE方法是基于插值的方法，它可以为小样本类合成新的样本，主要流程为：
（SMOTE通过在小样本类中的样本之间进行插值来生成新样本）
在这里插入图片描述

第一步，定义好特征空间，将每个样本对应到特征空间中的某一点，根据样本不平衡比例确定好一个采样倍率N；
第二步，对每一个小样本类样本(x,y)，按欧氏距离找出K个最近邻样本，从中随机选取一个样本点，假设选择的近邻点为(xn,yn)。在特征空间中样本点与最近邻样本点的连线段上随机选取一点作为新样本点，满足以下公式：
第三步，重复以上的步骤，直到大、小样本数量平衡。

（2）mixup

mixup是Facebook人工智能研究院和MIT在“Beyond Empirical Risk Minimization”中提出的基于邻域风险最小化原则的数据增强方法，它使用线性插值得到新样本数据。

令(xn,yn)是插值生成的新数据，(xi,yi)和(xj,yj)是训练集随机选取的两个数据，则数据生成方式如下:
在这里插入图片描述

λ的取指范围介于0到1。
提出mixup方法的作者们做了丰富的实验，实验结果表明可以改进深度学习模型在ImageNet数据集、CIFAR数据集、语音数据集和表格数据集中的泛化误差，降低模型对已损坏标签的记忆，增强模型对对抗样本的鲁棒性和训练生成对抗网络的稳定性。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
数据增强的方法

数据增强
复制链接

扫一扫

专栏目录

α木子 CSDN认证博客专家 CSDN认证企业博客

码龄4年

32: 原创

20万+: 周排名

65万+: 总排名

2万+: 访问

: 等级

329: 积分

14: 粉丝

11: 获赞

4: 评论

69: 收藏

私信

关注

热门文章

分类专栏

最新评论

ubuntu18.04安装cuda11.0+cudnn+Anaconda+pytorch1.7.1
yayyayyay2: zui hou yi bu wo da kai le guan wang ,dan shi yao zhen mo xia zai a?
Excel初识-1
CSDN-Ada助手: 恭喜您写了第20篇博客，标题为“Excel初识-1”，非常有意思！您的分享对于初学者来说非常有帮助。接下来，我建议您可以深入探究Excel的高级功能，例如数据透视表、宏等。期待您更多的优质分享！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply20 看奖励名单。
cuda11.0安装pytorch方法
one_day _one_post: 太优秀了，安装好了
cuda11.0安装pytorch方法
gorgeousyyy: 感天动地我装了两天用博主的下好了555555！！！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。