CNN当中的视角不变性和旋转不变性是什么意思

松小白song

已于 2024-05-24 17:37:49 修改

阅读量1.1k

点赞数 1

文章标签： cnn 深度学习人工智能

于 2023-05-28 16:38:04 首次发布

本文链接：https://blog.csdn.net/weixin_47151388/article/details/130914242

版权

前言

在卷积神经网络（CNN）中，视角不变性和旋转不变性是指网络在识别物体时能够忽略某些变化，如视角或旋转角度的改变，仍能正确地进行识别。

一、视角不变性

视角不变性是指网络对物体在不同视角下的图像表现出一致的识别能力。例如，如果一个物体从不同的角度被拍摄，卷积神经网络能够理解这些图像都是同一个物体。这种特性在实际应用中非常重要，因为在现实世界中，物体往往不会总是以同一个视角呈现。

实现方式：

数据增强：通过在训练数据中引入各种视角的变换，如平移、缩放、翻转等，来让网络学习到不同视角下的图像特征。
卷积层和池化层：卷积层能够提取局部特征，池化层则通过下采样来降低图像分辨率，捕捉图像的局部不变性。
视角变换网络（Spatial Transformer Networks, STN）：这是一种特定的网络结构，能够学习到对输入图像进行适当的空间变换，以消除视角差异对识别的影响。

二、旋转不变性

旋转不变性是指网络能够正确识别旋转过的物体。例如，如果一个物体在图像中被旋转了不同的角度，卷积神经网络仍然能够识别出这是同一个物体。这种特性对于识别诸如交通标志、手写字符等物体尤其重要，因为这些物体在实际应用中可能会以不同的角度出现。

实现方式：

数据增强：通过在训练数据中引入旋转变换（在一定范围内随机旋转图像）来让网络学习到不同角度下的图像特征。
旋转卷积（Rotation Equivariant Convolution）：这种卷积操作能够显式地考虑到输入特征的旋转，学习到具有旋转不变性的特征。
旋转不变池化（Rotation Invariant Pooling）：在池化层中，通过结合不同旋转角度下的特征图，达到旋转不变的效果。