Affine Transformation中Rotate Transformation的等价变换

最新推荐文章于 2024-07-31 11:32:55 发布

KCDKFT

最新推荐文章于 2024-07-31 11:32:55 发布

阅读量1k

点赞数

分类专栏：机器学习心得图像 CNN

本文链接：https://blog.csdn.net/kuaitoukid/article/details/51956115

版权

机器学习同时被 3 个专栏收录

17 篇文章 1 订阅

订阅专栏

心得

13 篇文章 0 订阅

订阅专栏

CNN

12 篇文章 0 订阅

订阅专栏

2D图像中的仿射变换种类有平移，旋转，放缩与SHEAR变换，具体公式可以参考http://cn.mathworks.com/discovery/affine-transformation.html

最近的工作是为了训练一个网络来回归这些仿射变换参数，比如平移了多少，放缩了多少等等，但是博主发现，当不考虑SHEAR变换的时候，其他三个变换的参数量都能极好的学习，而且泛化性有很好的保障，但是加入了SHEAR变换之后，我发现根本就训练不动了，原因是如下：

1. 在不考虑SHEAR变换的时候，仿射变换矩阵为[scale * cos(theta), scale * sin(theta), 0; scale * -sin(theta), scale * cos(theta), 0; tx ty 1] 可以看出，平移，旋转以及放缩的参数耦合性并不强，并且从图像上我们也能直观的看出平移量，旋转量以及放缩量，学习难度也是依次递增

2. 当考虑SHEAR变换的时候，仿射变换矩阵就特别复杂，参数的耦合非常强，直观的解释是，我们很难从图像中读出我们做了多少的旋转，放缩，以及SHEAR变换，这也就是为什么加了SHEAR之后，根本训练不动。

然后，更深层次的原因是，我们想通过图像直接逆回去求SHEAR，ROTATE，SCALE，TRANSLATION四个矩阵（考虑了变换顺序），但是这四个矩阵确定是唯一的吗？没有SHEAR我们确定是唯一的，但是有了SHEAR就不是了，为什么？因为ROTATE可以表示为SHEAR*SCALE！具体证明也很简单，在此略过。

所以当考虑SHEAR矩阵的时候，就不应该再考虑ROTATE矩阵，这会让整个模型没法去根据图像逆回去求对应的变换参数，这也就解释了为什么，SHEAR跟SCALE的LOSS下降的比ROTATE的LOSS要小，因为分类器在尝试把ROTATE用SHEAR跟SCALE表示。但是当没有SHEAR变换的时候，ROTATE的LOSS是要降的比SCALE快的，因为ROTATE的特征更容易提取。

以上的内容可能大家都看不懂，属于我自己工作中遇到的问题的碎碎念了= =