mask-rcnn 学习笔记(图像预处理--图像增强)

  论文:http://cn.arxiv.org/pdf/1703.06870v3
  介绍时所采用的Mask-RCNN源码(python版本)来源于GitHub:https://github.com/matterport/Mask_RCNN

1.图像增强概念

  上一篇博客讲述了如何进行图像缩放,本篇主要讲解常用的一些数据增强的方法及适用场景。
  深度学习是基于大数据的一种方法,数据规模越大,质量越高,模型的泛化能力越强。当数据集比较小时,除了通过收集更多数据,还可以利用图像增强的方法来扩充数据集。
  数据增强,就是对原始图像进行一定的图像处理。一方面在一定程度上提升模型的泛化能力;另一方面还可以达到提升模型鲁棒性的效果,比如增加噪声数据。

2.图像增强分类

  • 离线增强:
      在训练过程前对数据集m进行处理,数据数目变为原数据的n倍。模型学习的样本变为m*n。该方法适用于数据集比较小时,扩充后的数据需要占用一定的存储空间。
  • 在线增强 :
      在训练过程中对数据集m进行处理,获得一个 batch 的数据之后,然后对这个 batch 的数据进行增强,最后再输入网络进行学习。模型学习的样本为m*epochs,随着epochs的增大,该方式学习的样本数量要远比离线方式多。这种方式常用于大数据集以及图像处理用时较短时。很多机器学习框架已经支持了这种数据增强方式,并且可以使用 GPU 优化计算。

3.mask-rcnn图像增强方式

  作者在源码中使用imgaug库进行图像增强,imgaug是一个封装好的用来进行图像增强的python库,官方文档:https://imgaug.readthedocs.io/en/latest/。其使用方法非常简单:

  • 定义一个图像增强序列,
    augment_seq = imgaug.augmenters.Sequential( [增强1, 增强2, ...])
  • 调用模型的train方法时,传递给参数augmentation。
    model.train(augmentation&#
  • 6
    点赞
  • 41
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值