photometric distortions and geometric distortions

最新推荐文章于 2024-10-03 19:05:59 发布

鱼儿会飞吗

最新推荐文章于 2024-10-03 19:05:59 发布

阅读量309

点赞数 6

文章标签：计算机视觉人工智能深度学习

本文链接：https://blog.csdn.net/qq_34425255/article/details/142693995

版权

数据增强的目的是增加输入图像的多样性，从而提高所设计的物体检测模型对来自不同环境图像的鲁棒性。通过增加训练数据的变异性，模型能够更好地适应各种拍摄条件和场景。

光度失真（Photometric Distortions）：

这类失真主要涉及图像的颜色和亮度变化。常见的技术包括：
- 亮度调整：增加或减少图像的整体亮度。例如，将一张原本明亮的图像调暗，使其在低光条件下的表现更好。
- 对比度调整：增强或减弱图像的对比度，使得图像中的物体更加突出。
- 色彩抖动：随机改变图像的颜色通道，增加颜色的多样性。

几何失真（Geometric Distortions）：

这类失真主要涉及图像的空间形状变化。常见的技术包括：
- 旋转：将图像旋转一定角度，使模型能够识别不同角度的物体。
- 缩放：改变图像的大小，以适应不同距离拍摄的物体。
- 翻转：水平或垂直翻转图像，以增加不同视角的样本。

亮度调整：
- 假设原始图像是一张在阳光明媚的日子里拍摄的花园照片，其中五颜六色的花朵色彩鲜艳。通过降低亮度，可以生成一张相同场景的图像，模拟阴天或黄昏的光线条件。这使得模型可以学习如何在不同光照下识别花朵的颜色和形状。
对比度调整：
- 一张室内拍摄的食物照片，色彩较为平淡。通过增加对比度，图像中的食物颜色变得更加鲜明，细节更加突出。这样，模型在训练时可以更好地学习到食物的特征，无论是在高对比度还是低对比度的情况下。
色彩抖动：
- 一张拍摄的蓝色汽车的照片，颜色非常鲜艳。通过对颜色通道进行随机抖动，生成的图像可能会变成略带绿色或紫色的汽车图像。这样，模型可以学习到汽车的形状和特征，而不是仅仅依赖于特定的颜色。
白平衡调整：
- 一张在不同光源（如荧光灯或日光灯）下拍摄的照片，可能会导致颜色偏差。通过调整白平衡，可以生成一张更自然的图像，帮助模型适应不同光源下的物体识别。

以上举例展示了光度失真的不同方法，通过改变图像的亮度、对比度、色彩和白平衡等特征，增强了模型对不同光照条件的适应能力，从而提高物体检测的准确性和鲁棒性。

旋转：
- 假设原始图像是一张正面拍摄的狗的照片。通过将图像旋转90度，生成的图像将展示狗的侧面。这种失真帮助模型学习在不同角度下识别狗的特征，从而提高对狗的检测能力。
缩放：
- 一张拍摄的街道场景，其中有一辆汽车。通过缩小图像，使汽车看起来更远，模型可以学习如何识别远处的汽车。这使得模型在处理不同距离的物体时更加灵活。
翻转：
- 一张展示猫咪的图像，猫咪面朝右侧。通过水平翻转，可以得到一张猫咪面朝左侧的图像。这种方式增加了训练样本的多样性，使模型能在识别时不受物体朝向的限制。
裁剪：
- 原始图像是一张完整的水果篮，包含苹果、香蕉和橙子。通过裁剪图像，只保留其中的苹果部分，模型能够学习到苹果的特征。这样的裁剪可以帮助模型更好地识别部分可见的物体。
透视变换：
- 一张正面拍摄的建筑物图像，可以通过透视变换将其角度改变，使得建筑物的顶部看起来更窄。这种变换帮助模型学习在不同视角下识别建筑物的特征。