Deepfake detection【Datawhale AI夏令营】数据增强方法

deepfake detection比赛链接https://www.kaggle.com/competitions/multi-ffdi

训练分类模型判别图片是否为AI生成图片,探究不同数据增强方法对模型表现的影响。

1、数据增强方法

图像分类任务中常见的数据增强方法:
(1) 几何变换:

  • 随机裁剪(Random Cropping):随机从原始图像中裁剪出固定大小的区域,这有助于模型学习不同位置的特征。
    transforms.RandomCrop(128)

在这里插入图片描述

  • 随机缩放(Random Scaling):对图像进行随机缩放,增加模型对不同尺度对象的识别能力。在本次任务中,将训练和验证数据统一resize到(256, 256),使所有数据相同大小的分辨率,又能够减少显存占用。
    transforms.RandomResizedCrop(256)在这里插入图片描述
  • 随机旋转(Random Rotation):随机选择一个角度对图像进行旋转,有助于模型学习不同角度的视觉特征。
    transforms.RandomRotation(degrees=(-45, 45))
    在这里插入图片描述
  • 随机翻转(Random Flip):以一定的概率对图像进行水平或垂直翻转,增加数据的多样性。
    transforms.RandomHorizontalFlip()
    在这里插入图片描述
    transforms.RandomVerticalFlip()
    在这里插入图片描述

(2) 颜色和光照变换

  • 颜色抖动(Color Jittering):随机调整图像的亮度、对比度、饱和度和色调,使模型更具鲁棒性。
    transforms.ColorJitter(brightness=0.4, contrast=0.4, saturation=0.4, hue=0.1)
    在这里插入图片描述

  • 随机灰度变换(Random Grayscale):以一定概率将图像转换为灰度图像,这种变换可以降低模型对颜色的依赖,增加泛化能力。
    transforms.RandomGrayscale(0.8)在这里插入图片描述

  • 随机色彩噪声(Random Color Noise):向图像中添加随机颜色噪声,模拟真实场景中的光照变化和传感器噪声。

在这里插入图片描述

(3) 空间变换

  • 弹性变形(Elastic Distortion):通过对图像进行局部扭曲,模拟图像变形的情况,增加模型对形变的鲁棒性。

(4) 混合增强

  • Mixup:将两幅图像按照一定比例进行混合,即生成一个新的图像,标签则按照比例混合。这有助于模型更好地处理类别之间的边界和提升泛化能力。
  • Cutmix:通过将一个图像的一部分剪切并粘贴到另一个图像上来创建新的训练样本。

2、实验对比不同数据增强方法的效果

代码来自:https://www.kaggle.com/code/chg0901/0-98-deepfake-ffdi-ways-to-defeat-0-86-beseline

数据增强方法验证集acc
水平方向和垂直房向的翻转78.75%
RandomCrop(128)79.22%
  • 4
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
mmdetection是基于PyTorch的目标检测框架,它提供了一些数据增强方法可以用于数据预处理。具体而言,它使用了mmcv库来提供数据增强方法。 以下是一些常见的数据增强方法: 1. 随机翻转:对于每张图片,以一定的概率随机进行水平或垂直翻转来增加数据样本的数量。 2. 随机裁剪:对于每张图片,以一定的概率随机进行裁剪来增加数据样本的数量。 3. 颜色抖动:对于每张图片,以一定的概率随机调整图像的亮度、对比度和饱和度来增加数据样本的多样性。 4. 尺度变换:对于每张图片,以一定的概率随机缩放图像来增加数据样本的数量。 在mmdetection中,这些数据增强方法可以通过创建一个数据增强的配置文件来实现。具体而言,你需要在配置文件中指定增强方法的名称和其对应的参数,然后在训练时将该配置文件传递给训练脚本。 以下是一个使用颜色抖动和随机裁剪的数据增强示例: ```python train_pipeline = [ dict(type='LoadImageFromFile'), dict(type='LoadAnnotations', with_bbox=True), dict(type='RandomFlip', flip_ratio=0.5), dict(type='RandomCrop', crop_size=(800, 800)), dict(type='Resize', img_scale=[(1333, 800), (1333, 640)], keep_ratio=True), dict(type='Normalize', **img_norm_cfg), dict(type='Pad', size_divisor=32), dict(type='DefaultFormatBundle'), dict(type='Collect', keys=['img', 'gt_bboxes', 'gt_labels']), ] ``` 这里,RandomCrop和Resize方法用于随机裁剪和尺度变换,而Normalize方法用于归一化图像像素值。你可以根据自己的需求选择不同的数据增强方法

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值