数据增强(data augmentation)

Annyufeng

于 2023-11-19 21:24:06 发布

阅读量547

点赞数 5

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Annyufeng/article/details/134495732

版权

数据增强 data augmentation

目的：

避免过拟合当数据集具有某种明显特征时例如实在同一个场景里面拍摄的使用Cutout等方法可以避免模型学到跟目标无关的信息
提升模型鲁棒性
增加训练数据，提高模型泛化能力
避免样本不均衡

常用的方法：

几何变换——翻转，旋转，裁剪，缩放，平移，抖动。

像素变换——加噪声，进行高斯模糊，调整HSV对比度，调节亮度，饱和度等等

具体方法：

Mixup Cutmix：可用于分类任务

补充知识：one-hot编码独热编码一位有效编码词袋模型

举例说明：

优点：便于处理离散数据

可以进行扩充特征

缺点🍶 词袋模型并不考虑词与词的顺序🇼🇫

特征是离散稀疏的

Mixup: 为了解决经验风险最小化 ERM 强行记住训练数据

https://arxiv.org/abs/1710.09412，提出了mixup

Cutout

在ResNet的基础上意思是CutMix的效果最好

接着讲回数据增强

还有一种增强方法是GridMask

还有一些网络中的增强例如DropOut DropConnect等

文本有关的数据增强

EDA简单且有效包括随机替换，随机插入，随机交换，随机删除

AEDA 在句子中间添加标点符号一次来增强数据

Back Translation 回译先翻译成其他语言在翻译回来

MLM 掩码语言模型利用与训练好的BERT Roberta 对句子进行部分掩码，然后让模型预测掩码部分

总结：

data augmentation 多为对原始数据的简单变换，包括旋转翻转向量加在一块随机的替换或者遮挡，用于生成更多数据，增强模型精确率。

关注

5
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Annyufeng CSDN认证博客专家 CSDN认证企业博客

码龄3年

15: 原创

130万+: 周排名

11万+: 总排名

3026: 访问

: 等级

187: 积分

280: 粉丝

32: 获赞

15: 评论

24: 收藏

私信

关注

热门文章

最新评论

OUC2024机器学习期末考试（回忆版）
CSDN-Ada助手: Python入门技能树或许可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
OUC离散数学II实验一C++ 判断连通图（欧拉回路）
CSDN-Ada助手: 恭喜您写下了第11篇博客！您对OUC离散数学II实验一C++ 判断连通图（欧拉回路）的探讨非常深入，让读者受益匪浅。接下来，我建议您可以尝试扩大话题范围，探讨更多与离散数学相关的实验或者应用，让读者可以从不同角度了解这门学科。期待您的下一篇博客！
OUC离散数学II实验二C++之最“笨”方法
CSDN-Ada助手: 恭喜您在OUC离散数学II实验二C++方面的探索和实践！看到您勇于尝试“最‘笨’”的方法并写成博客分享，实属不易。希望您能继续保持对计算机科学的热情，不断探索和学习新的知识和技能。或许下一步可以尝试更深入的算法设计或者与其他编程语言结合实践，相信会有更多收获和成长。期待您的下一篇作品！
OUC离散数学II实验三C++
CSDN-Ada助手: 恭喜你写了第13篇博客！你对OUC离散数学II实验三C++的内容进行了深入的探讨，让读者受益匪浅。希望你能继续坚持创作，分享更多关于离散数学和C++的知识，也可以考虑结合实际案例或者个人经历进行更深入的解读，这样会更吸引读者。加油！
OUC离散数学II实验四C++
CSDN-Ada助手: 恭喜你写完了第14篇博客！能够坚持不懈地创作是一件了不起的事情。希望你能继续保持这样的创作热情，不断提升自己的写作水平。下一步建议可以尝试探索一些新的主题或者加入一些个人观点，让读者更加深入地了解你对离散数学II实验四C++的见解。加油！期待你的下一篇作品。

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。