论文阅读：深度学习图像数据增广方法研究综述

BulingQAQ

已于 2024-09-09 17:09:37 修改

阅读量2.9k

点赞数 56

分类专栏：论文阅读图像生成文章标签：论文阅读深度学习人工智能

于 2024-09-07 00:02:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/OctYZ/article/details/141979102

版权

摘要

背景：

充足的训练数据不仅可以缓解模型在训练时的过拟合问题，而且可以进一步扩大参数搜索空间，帮助模型进一步朝着全局最优解优化。
然而，在许多领域或任务中，获取到充足训练样本的难度和代价非常高。因此，数据增广成为一种常用的增加训练样本的手段。

本文贡献：

按照方法本质原理的不同，将其分为单数据变形、多数据混合、学习数据分布和学习增广策略等 4 类方法。
单数据变形方法主要可以分为几何变换、色域变换、清晰度变换、噪声注入和局部擦除等 5 种；
多数据混合可按照图像维度的混合和特征空间下的混合进行划分；
学习数据分布的方法主要基于生成对抗网络和图像风格迁移的应用进行划分；
学习增广策略的典型方法可以按照基于元学习和基于强化学习进行分类

前景：

根据数据和任务
基于强化学习探索最优的组合策略，
基于元学习自适应地学习最优数据变形和混合方式，
基于生成对抗网络进一步拟合真实数据分布以采样高质量的未知数据，
基于风格迁移探索多模态数据互相转换的应用

0. 引言

在许多研究领域，受限于数据获取难度大、标注成本高等原因，往往难以获得充足的训练数据，这样训练得到的深度学习模型往往存在过拟合的问题，进而导致模型泛化能力差、测试精度不高等，难以满足应用需求。

数据增广，又称数据增强( data augmentation) ，是一种增加有限数据的数量和多样性的策略，旨在从有限的数据中提炼出更多有用的信息，产生等价于更多数据的价值。数据增广方法试图从过拟合问题的根源———训练样本不足，去解决该问题。

数据增广可以分为数据变形 (data warping) 和 数据过采样 ( oversampling)两种方法。

数据变形类：LeNet-5、AlexNet、VGGNet、GoogleNet、ResNet、DenseNet中都有用到。

多幅图像信息混合：SamplePairing 、mixup、SMOTE等，这类方法本质上属于数据过采样。

GAN：Frid-Adar 等

元学习和强化学习的思想：训练一个模型去自适应地选用最优的数据增广策略，来实现模型性能提升的最大化。AutoAugment 和 RandAugment

本文从另外的角度，即从数据增广的生成方式综述，将数据扩增方法分为单数据变形、多数据混合、学习数据分布规律生成新数据和学习增广策略等 4 类方法。

1. 单数据变形

1.1 几何变换

几何变换 ( geometric transformations)是最常见的图像数据增广方法，通过旋转、镜像、平移、裁剪、缩放和扭曲等变换方式生成新样本。
在实际任务中，需要根据数据的特点选择合适的几何变换方法才能进一步带来模型性能的提升，否则可能适得其反。
虽然几何变换的方式简单易操作，但也存在对数据重复记忆、增加的信息量有限等缺点，这

最低0.47元/天解锁文章

博客等级

码龄5年

20
原创

532
点赞

470
收藏

335
粉丝

关注

私信

热门文章

分类专栏

最新评论

论文阅读：A Progressive Generative Adversarial Method for Structurally Inadequate Medical Image Data Augm
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：DSAGAN: A generative adversarial network based on dualstream attention mechanism for anatomical
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：Image Translation for Medical Image Generation: Ischemic Stroke Lesion Segmentation
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：Deep Learning Approaches for Data Augmentation in Medical Imaging: A Review
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：Synthetic data accelerates the development of generalizable learning-based algorithms for X-ray
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。