AI训练数据集中图片数据增强工具有哪些-CSDN博客

本文链接：https://blog.csdn.net/yuanpan/article/details/146494513

图片数据增强是提高模型泛化能力的重要手段，尤其在数据集较小或多样性不足时非常有用。以下是一些常用的图片数据增强工具和方法：

1. 常用图片数据增强工具

1.1 Albumentations

特点：高效、灵活，支持多种增强操作，特别适合计算机视觉任务。
支持的操作：旋转、缩放、裁剪、翻转、颜色变换、噪声添加、模糊等。
安装：
bash
```
pip install albumentations
```

示例：

python

import albumentations as A

transform = A.Compose([
    A.RandomCrop(width=256, height=256),
    A.HorizontalFlip(p=0.5),
    A.RandomBrightnessContrast(p=0.2),
])

augmented = transform(image=image)
augmented_image = augmented['image']

1.2 torchvision.transforms

特点：PyTorch 官方提供的图像增强工具，简单易用，适合与 PyTorch 模型一起使用。
支持的操作：裁剪、翻转、旋转、颜色变换、归一化等。
安装：
bash
```
pip install torchvision
```

示例：

python

from torchvision import transforms

transform = transforms.Compose([
    transforms.RandomHorizontalFlip(),
    transforms.RandomRotation(30),
    transforms.ColorJitter(brightness=0.2, contrast=0.2),
])

augmented_image = transform(image)

1.3 imgaug

特点：功能强大，支持复杂的增强操作，适合高级用户。
支持的操作：几何变换、颜色变换、噪声添加、模糊、仿射变换等。
安装：
bash
```
pip install imgaug
```

示例：

python

import imgaug.augmenters as iaa

seq = iaa.Sequential([
    iaa.Fliplr(0.5),  # 水平翻转
    iaa.GaussianBlur(sigma=(0, 1.0)),  # 高斯模糊
    iaa.AdditiveGaussianNoise(scale=(0, 0.1)),  # 添加高斯噪声
])

augmented_image = seq(image=image)

1.4 OpenCV

特点：灵活且功能强大，适合自定义增强操作。
支持的操作：几何变换、颜色空间转换、滤波、边缘检测等。
安装：
bash
```
pip install opencv-python
```

示例：

python

import cv2
import numpy as np

# 旋转
rows, cols = image.shape[:2]
M = cv2.getRotationMatrix2D((cols/2, rows/2), 45, 1)  # 旋转45度
rotated_image = cv2.warpAffine(image, M, (cols, rows))

1.5 Keras ImageDataGenerator

特点：适合与 Keras/TensorFlow 模型一起使用，简单易用。
支持的操作：旋转、缩放、翻转、颜色变换等。
安装：
bash
```
pip install tensorflow
```

示例：

python

from tensorflow.keras.preprocessing.image import ImageDataGenerator

datagen = ImageDataGenerator(
    rotation_range=30,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True,
)

augmented_image = datagen.random_transform(image)