1.几个问题
1.1 做了什么
提出一种能保证全局旋转等变性的卷积神经网络。
能对四个旋转方向提取特征。
1.2 效果
略
1.3 局限性 & 创新性
相比于TI-POOLING,这篇论文实现了多层协变网络。
但是它只能实现四个方向的旋转,因为矩阵是方形的,最多作用在p4群上。
2.数学部分
2.1 旋转操作
图像函数为 f : Z 2 → R f:{Z^2} \to R f:Z2→R。定义旋转变换 R R R(这里的R不是实数域的意思), R ( f ( x ) ) , x ∈ Z 2 R\left( {f\left( x \right)} \right),x \in {Z^2} R(f(x)),x∈Z2相当于将图像顺时针喜欢转90°。
以下定理证明都可以用画图法直观验证,不再进行详细数学描述。
定理1:四次旋转相当于恒等变换
R 4 = I {R^4} = I R4=I
定理2:加法分配律
R ( f 1 + f 2 ) = R ( f 1 ) + R ( f 2 ) R\left( { {f_1} + {f_2}} \right) = R\left( { {f_1}} \right) + R\left( { {f_2}} \right) R(f1+f2)=R(f1)+R(f2)
定理3:卷积核交换律
假设有一个定义在 Z 2 Z^2 Z2上的卷积核和图像 F = f ( x ) F=f(x) F=f(x),则
R ( I ∗ ψ ) = R ( I ) ∗ R ( ψ ) R\left( {I*\psi } \right){\rm{ = }}R\left( I \right){\rm{*}}R\left( \psi \right) R(I∗