【深度学习】数据增强基本介绍和常用的数据增强方法

最新推荐文章于 2025-04-04 18:57:51 发布

Captain_Koucha

最新推荐文章于 2025-04-04 18:57:51 发布

阅读量1.7w

点赞数 35

文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/F2ancisZ/article/details/140228966

版权

一数据增强简介

数据增强（Data Augmentation）是一种技术，通过对现有数据进行各种变换和处理来生成新的训练样本，从而增加数据集的多样性和数量。这些变换可以是几何变换、颜色变换、噪声添加等，使模型在训练过程中能够见到更多种类的数据，从而提升模型的泛化能力和鲁棒性。
在机器学习和深度学习中，数据的数量和质量对模型的性能至关重要。然而，获取大量标注数据通常既耗时又昂贵。数据增强通过对现有数据进行多种处理，模拟出更多样化的训练样本，有效解决了数据稀缺的问题。这样不仅能防止模型过拟合（即模型在训练数据上表现很好，但在测试数据上表现不佳），还能够提升模型在不同情况下的表现，使其具有更强的泛化能力。
数据增强的方法多种多样，既有传统的基于图像处理的方法，如翻转、旋转、缩放、平移、裁剪、颜色变换、噪声添加、模糊和仿射变换等；也有基于模型生成的方法，如生成对抗网络（GAN）、变分自编码器（VAE）和增强对抗样本等。此外，还有主动学习增强方法，如主动学习、领域自适应、混合策略和样本重要性采样等。这些方法各有优劣，可以根据具体任务和数据特点灵活选择和组合使用，以达到最佳的数据增强效果。通过数据增强，模型能够在有限的数据基础上获得更多的训练样本，提高训练效率和效果，最终在实际应用中表现得更加稳健和可靠。

二数据增强方法

2.1 传统几何变换方法

传统的图像处理或者说几何变换方法可以用来扩充数据集，提高训练效果。一般成熟的训练框架都会集成相关的方法，以下是一个示例程序，把每个功能独立地写在函数里。程度读取一张图片，用户在各部分的函数块里设置该种方法的相关参数，然后在主程序里选择若干种想要采用的数据增强方法。最后输出结果图片并保存到指定文件夹。

import os
import random
from PIL import Image, ImageEnhance, ImageOps, ImageFilter

# 翻转图像
def flip_image(image, mode='horizontal'):
    if mode == 'horizontal':
        return image.transpose(Image.FLIP_LEFT_RIGHT)
    elif mode == 'vertical':
        return image.transpose(Image.FLIP_TOP_BOTTOM)
    else:
        raise ValueError("Mode should be 'horizontal' or 'vertical'")

# 旋转图像
def rotate_image(image, angle):
    return image.rotate(angle)

# 缩放图像
def scale_image(image, scale_factor):
    width, height = image.size
    return image.resize((int(width * scale_factor), int(height * scale_factor)))

# 平移图像
def translate_image(image, x, y):
    return ImageOps.offset(image, x, y)

# 裁剪图像
def crop_image(image, crop_box):
    return image.crop(crop_box)

# 调整亮度、对比度、饱和度、色调
def adjust_color(image, brightness=1, contrast=1, saturation=1, hue=1):
    enhancer = ImageEnhance.Brightness(image)
    image = enhancer.enhance(brightness)
    enhancer = ImageEnhance.Contrast(image)
    image = enhancer.enhance(contrast)
    enhancer = ImageEnhance.Color(image)
    image = enhancer.enhance(saturation)
    # hue adjustment not directly available in PIL, skipped
    return image

# 添加噪声
def add_noise(image, noise_type='gaussian', mean=0, std=1):
    # This function is a placeholder; PIL doesn't support direct noise addition
    return image

# 模糊图像
def blur_image(image, blur_type='gaussian', radius=2):
    if blur_type == 'gaussian':
        return image.filter(ImageFilter.GaussianBlur(radius))
    elif blur_type == 'motion':
        return image.filter(ImageFilter.MotionBlur(radius))  # Pillow doesn't have MotionBlur, custom implementation needed
    else:
        raise ValueError("Blur type should be 'gaussian' or 'motion'")

# 仿射变换
def affine_transform(image, matrix):
    return image.transform(image.size, Image.AFFINE, matrix)

def