图像自动增广

最新推荐文章于 2022-08-15 20:21:32 发布

爱格白

最新推荐文章于 2022-08-15 20:21:32 发布

阅读量368

点赞数

分类专栏：阅读笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zj71hmvx/article/details/119171926

版权

阅读笔记专栏收录该内容

22 篇文章 2 订阅

订阅专栏

github上用pillow库实现的非官方ImageNet, CIFAR 10 和 SVHN 的自动增广

用自动增广提高深度学习的能力[谷歌AI, 2018]

AutoAugment 算法为一些最著名的计算机视觉数据集找到了增强策略，当将这些策略结合到神经网络的训练中时，可以达到最优的准确性

自动增广

数据增强背后的想法很简单：图像具有许多对称性，变化后不会改变图像中存在的信息。mixup方法在训练期间将图像叠加在一起来获得增强后的数据，从而提高神经网络性能。

自动增广(AutoAugment)是一种为计算机视觉数据集设计的自定义数据增强策略的自动方法。如：水平/垂直翻转图像、旋转图像、更改图像颜色等。不仅可以预测要组合哪些图像变换，还可以预测所使用变换的每个图像的概率和幅度，因此图像并不以相同的方式处理。

AutoAugment 根据运行的数据集学习不同的转换。例如，对于涉及门牌号街景的图像(SVHN) 包括数字的自然场景图像，AutoAugment 专注于几何变换，如剪切和平移，它们代表了该数据集中常见的失真。此外，考虑到世界上不同建筑和门牌号材料的多样性，AutoAugment 已经学会了完全反转原始 SVHN 数据集中出现的自然颜色。

在这里插入图片描述
在 CIFAR-10 和 ImageNet 上，AutoAugment 不使用剪切，因为这些数据集通常不包含剪切对象，也不会完全反转颜色，这些转换会导致不真实的图像。相反，AutoAugment 会稍微调整颜色和色调分布，同时保留一般颜色。
这表明 CIFAR-10 和 ImageNet 中对象的实际颜色很重要，而在 SVHN 上只有相对颜色很重要。
在这里插入图片描述

词汇

street view of house numbers 街景门牌号(SVHN)

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
图像自动增广

github上用pillow库实现的非官方ImageNet, CIFAR 10 和 SVHN 的自动增广用自动增广提高深度学习的能力[谷歌AI, 2018]AutoAugment 算法为一些最著名的计算机视觉数据集找到了增强策略，当将这些策略结合到神经网络的训练中时，可以达到最优的准确性自动增广数据增强背后的想法很简单：图像具有许多对称性，变化后不会改变图像中存在的信息。mixup方法在训练期间将图像叠加在一起来获得增强后的数据，从而提高神经网络性能。自动增广(AutoAugment)是一种为计算
复制链接

扫一扫

专栏目录

博客等级

码龄5年

68
原创

35
点赞

197
收藏

29
粉丝

关注

私信

热门文章

分类专栏

学习笔记 40篇
FYP 4篇
阅读笔记 22篇
实习笔记 5篇

最新评论

语音处理的线性预测
qq_56543781: 计算线性预测系数以最小化语音数据帧上的平方和“预测误差”（“残差信号”），均方误差 (MSE) 。这具有“白化”误差信号的效果（即展平其频谱请问这是为什么呀
Cepstral Analysis 倒谱分析
侯的善愁: 为什么MFCC可以用DCT来估计倒谱信息，而不是用IDCT呢？
检测PPG信号的峰值
爱格白: 确实舒张峰不好处理…这几个都是基于收缩峰的检测的
检测PPG信号的峰值
是指猴子: 这个几个方法是都只能找到收缩缝吗？现在在做脉搏相关的，不知道可不可以根据PPG的方法找峰值？试了下舒张峰感觉不太好找。
Knowledge & Reasoning 复习
Cardinal_Sins: 萨大的学长吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。