目标检测常用的数据增强方法解析

最新推荐文章于 2024-08-15 13:53:48 发布

豆豆小朋友小笔记

最新推荐文章于 2024-08-15 13:53:48 发布

阅读量2.2k

点赞数

分类专栏：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40728805/article/details/103581374

版权

本文探讨了图像数据增强的重要方法，包括空间几何变换（如翻转、修剪、平移、尺度和旋转变换）和像素内容变换（如色彩抖动、对比度变换和噪声扰动）。在目标检测任务中，不仅需要对图像进行增强，还必须处理bounding box的转换。文章提到了TensorFlow的image模块和PyTorch的torchvision.transforms作为数据增强的工具，并推荐了albumentations库作为第三方增强库。此外，随机扩展、随机裁剪、随机镜像、亮度、对比度、色度、饱和度的随机变化以及随机噪声扰动都是常见的增强技术。

摘要由CSDN通过智能技术生成

图像的数据增强

数据增强的方法主要有：

翻转变换 flip
随机修剪 random crop
色彩抖动 color jittering
平移变换 shift
尺度变换 scale
对比度变换 contrast
噪声扰动 noise
旋转变换/反射变换 Rotation/reflection 等等

训练模型根据所用框架可使用框架内部函数，TensorFlow中有着一个image模块专门用于处理图片数据的预处理https://blog.csdn.net/LoseInVain/article/details/81774840，torchvision.transforms是pytorch中的图像预处理包https://blog.csdn.net/u014380165/article/details/79167753
在目标检测训练模型时，除了对图像就数据增强外，还需要对bounding box做相应的转换

比较详细的目标检测数据增强，具体可详看此篇文章https://blog.csdn.net/mzpmzk/article/details/100161187

第三方图像增强库实现

库1，https://github.com/aleju/imgaug

库2（推荐使用

最低0.47元/天解锁文章

豆豆小朋友小笔记

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。