The Effectiveness of Data Augmentation in Image Classification using Deep Learning读书笔记

最新推荐文章于 2022-04-09 12:52:45 发布

RRZS

最新推荐文章于 2022-04-09 12:52:45 发布

阅读量1.2k

点赞数

分类专栏：深度学习 cv data augment

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/beyondjv610/article/details/86554132

版权

深度学习同时被 3 个专栏收录

15 篇文章 0 订阅

订阅专栏

10 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

本文介绍了多种常见的数据增加的方法，包括传统的（翻转，旋转等），使用gan进行数据生成的，最好作者提出了自己的方法，并取得了跟state of the art类似的效果。

1.related work

作者指出一些常见的防止过拟合的方法：

在模型方面

（1）对weight加上正则项，（2）drop out ，（3）BN（对每一层进行标准化），（4）在大规模数据集预训练然后做迁移学习

在数据方面

（1）几何形状和颜色的数据增强（翻转，裁剪，平移），这几个方法都是对原始图片做一个映射，即Y = WX+b,其中X是原始的图片，Y是数据增强的图片。（3）使用gan进行生成数据，比如进行风格的转化

2.network

对于数据增强的网络，作者将两张同一类图片concate在一起作为输入，从而得到一张新生成的图片，并将这一张新生成的图片和原始的两张图片一起放入classifation网络进行训练，分类的loss会回传给上述两个网络从而更新其权重，这是第一个loss。同时，作者也尝试引入第二个loss，即计算新生成的图片和该类中任意挑选出来的图片之间的差别作为loss，比如MSE loss，但是该方法的效果并不冥想。

3.实验结果

该数据增强的方法总是比不使用数据增强的效果好，但是其不一定优于传统的数据增强的方法，作者建议可以尝试先使用传统的数据增强的方法，再使用其提出的方法。

个人觉得该方法比较适应于语音的数据增强，对提出来的特征直接进行数据增强而避免对原始语音进行数据增强。这是因为对原始语音进行数据增强之后还需要提取特征，大大增加了训练模型的时间。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
The Effectiveness of Data Augmentation in Image Classification using Deep Learning读书笔记

本文介绍了多种常见的数据增加的方法，包括传统的（翻转，旋转等），使用gan进行数据生成的，最好作者提出了自己的方法，并取得了跟state of the art类似的效果。1.related work作者指出一些常见的防止过拟合的方法：在模型方面（1）对weight加上正则项，（2）drop out ，（3）BN（对每一层进行标准化），（4）在大规模数据集预训练然后做迁移学习在数...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。