图像自动增广

github上用pillow库实现的非官方ImageNet, CIFAR 10 和 SVHN 的自动增广

用自动增广提高深度学习的能力[谷歌AI, 2018]

AutoAugment 算法为一些最著名的计算机视觉数据集找到了增强策略,当将这些策略结合到神经网络的训练中时,可以达到最优的准确性

自动增广

数据增强背后的想法很简单:图像具有许多对称性,变化后不会改变图像中存在的信息。mixup方法在训练期间将图像叠加在一起来获得增强后的数据,从而提高神经网络性能。

自动增广(AutoAugment)是一种为计算机视觉数据集设计的自定义数据增强策略的自动方法。如:水平/垂直翻转图像、旋转图像、更改图像颜色等。不仅可以预测要组合哪些图像变换,还可以预测所使用变换的每个图像的概率和幅度,因此图像并不以相同的方式处理。

AutoAugment 根据运行的数据集学习不同的转换。例如,对于涉及门牌号街景的图像(SVHN) 包括数字的自然场景图像,AutoAugment 专注于几何变换,如剪切和平移,它们代表了该数据集中常见的失真。此外,考虑到世界上不同建筑和门牌号材料的多样性,AutoAugment 已经学会了完全反转原始 SVHN 数据集中出现的自然颜色。

在这里插入图片描述
在 CIFAR-10 和 ImageNet 上,AutoAugment 不使用剪切,因为这些数据集通常不包含剪切对象,也不会完全反转颜色,这些转换会导致不真实的图像。相反,AutoAugment 会稍微调整颜色和色调分布,同时保留一般颜色。
这表明 CIFAR-10 和 ImageNet 中对象的实际颜色很重要,而在 SVHN 上只有相对颜色很重要。
在这里插入图片描述

词汇

street view of house numbers 街景门牌号(SVHN)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值