![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据增强
zzl_1998
XMU
展开
-
【Augmentation Zoo】Augmentation for small object detection的代码实现
MS COCO中对small object的定义是矩形框小于32 x 32。一、Oversampling:3x 效果最佳二、Augmentation:第3种策略最佳1. 用augmented图片替代original图片2. 将augmented图片复制一次3. augmented图片(0.5的概率执行)+ original图片三、Copy-Pasting Strategies1. 一张图片中,随机选择一个小目标进行多次复制,放置在随机位置。复制一次效果最好2. 一张图片原创 2020-08-03 17:27:52 · 1184 阅读 · 5 评论 -
【数据增强】Learning Data Augmentation Strategies for Object Detection 代码
现在的情况是:官方代码基于tf实现,另一个numpy版本的bug很多。blend(image1, imgage2, facotr)factor在0,1之间时,是interpolate,等于0时返回image1,等于1时返回image2factor大于1时,是extrapolate,会clip到0,255之间。具体计算:difference = image2 - image1scaled = factor * differencetemp = image1 + scaled..原创 2020-07-29 21:43:30 · 292 阅读 · 0 评论 -
【Augmentation Zoo】RetinaNet + VOC + KITTI的数据预处理-pytorch版
整合前段时间看的数据增强方法,并测试其在VOC和KITTI数据上的效果。这个项目的github仓库在:https://github.com/zzl-pointcloud/MyRetinaNet0722。RetinaNet的模型代码来自pytorch-retinanet。整个代码的处理逻辑是:1. 继承torch.Dataset类定义新的数据集类,如VocDatasets类,KittiDatasets类,重写__getitem__(image_index)函数,其功能是,输入图片序号,返回一个sa原创 2020-07-23 23:29:59 · 540 阅读 · 0 评论 -
【风格迁移】Perceptual Losses for Real-Time Style Transfer and Super-Resolution
本文的贡献在于将perceptual loss和feed-forward网络结合,处理速度很快。3.1 Image Transformation Networks 在上下采样中,使用步进和小步进卷积代替池化层。除残差模块外,均使用spatial batch normalization,输出层使用ReLU,将输出限制在[0, 255]。除第一和最后一层使用9 x 9卷积核外,其余均使用3 x 3卷积核。 输入和输出均为 3 x 256 x 256 使用5个残差模块,每个包含两个3 x ..原创 2020-07-18 15:43:36 · 1031 阅读 · 0 评论 -
【数据增强】Benchmarking Robustness in Object Detection: Autonomous Driving when Winter is Coming
本文贡献在于:提供三个简单易用的人造数据集 一些结论(详细看实验部分):backbone也在增强训练集(本文验证了风格迁移)上训练,测试效果更好,使用合并数据集训练,证明在真实数据集上也有表现不错。摘要图片扭曲和天气条件对深度学习在真实世界的应用影响很大 标准目标检测模型在腐蚀图片上性能下降(30-60%下降)贡献提出一个Robust Detection Benchmark,包含三个benchmark datasets,叫做PSCAL-C, COCO-C和Cityscapes..原创 2020-07-17 11:03:10 · 672 阅读 · 0 评论 -
【数据增强】AUGMIX: A SIMPLE DATA PROCESSING METHOD TO IMPROVE ROBUSTNESS AND UNCERTAINTY
与Cutout、Mixup、CutMix的效果对比:算法伪码:算法实际执行效果可视化:增强上图是本文使用的数据增强操作,来自AutoAugment。移除了其中会和ImageNet-C corruptions(测试集)重叠的操作:contrast, color, brightness, sharpness, cutout,图片噪音和模糊化操作。随机选择k个增强链,默认设置K = 3。每个增强链建立在随机选择的1-3个增强操作。Mixing增强后的图片通过mix...原创 2020-07-16 15:47:30 · 1219 阅读 · 0 评论 -
【数据增强】CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Features
x是图片,y是图片对应的label,通过合成两张训练图片a和b,生成新的训练样本。M是二值mask,大小与原图片一致。lam来源于Beta(alp, alp)分布。Alp设置为1,lam取自均匀分布(0,1)。设置bbox B,它的坐标是:裁剪图片a中的区域B,用图片b中的区域B填充。Mask M的长宽比例和原图片的一致。Bbox坐标通过下式得到:具体算法如下:.结果:On ImageNet classification, applying CutMix to ResN原创 2020-07-16 14:16:48 · 756 阅读 · 0 评论 -
【数据增强】Learning Data Augmentation Strategies for Object Detection
论文代码:github.com/tensorflow/tpu/tree/master/models/ official/detectionAbstractCOCO上的实验证明最优化的data augmentation使得模型+2.3mAP,使得单的推理模型取得最优结果50.7mAP。在COCO上最佳的策略可能同样可以改善模型在其他数据集上的结果,例如在VOC上+2,7mAPIntroduction在图像分类任务中,相较于人工设计数据增强策略,从数据中学习一个最优化策略是更好的。相较于分.原创 2020-07-10 19:10:14 · 299 阅读 · 0 评论