[论文理解]E(2)群等变可操控神经网络General E(2) - Equivariant Steerable CNNs

在这里插入图片描述
这篇很理论……比较难。

1.几个问题

1.1 基本信息

2019 NIPS

1.2 做了什么

1.3 实现方法 & 创新性

提出一个比较通用的E(2)群等变神经网络,囊括了前人提出的模型,平面上的旋转、平移等等变群。

将核空间约束分解为不可约子空间,并给出了群E(2)及其子群对该约束的求解方法。

给出了群表示如何改变特征图的概述,论述了群表示与非线性的兼容性。

1.4 代码

Github

2.数学部分 & 模型构建

2.1 欧式平面R^2的等距(Isometries)群

欧几里德群E(2)是平面R2的等距群,由平移、旋转和反射组成。E(2)中的群变换在实际图像中很常见。等距的意思就是这些变换不会改变平面上点的模长(例如,到原点的距离)。

在这里插入图片描述
在这里插入图片描述
下表是本论文中G的所有可能选择。
在这里插入图片描述

2.2 E(2)群-可操控特征场

可操控卷积神经网络(Steerable CNNs,是一篇论文)体系将特征空间定义为可操控特征场(Steerable feature fields) f f f的空间。

在这里插入图片描述

方向

与普通CNN相比,Steerable CNN的特征场与变换律是有关联的,该变换律规定了它们在E(2)(或子群)作用下的变换,从而赋予特征一个方向的概念。意思是,由于每个点x上都有一个矢量f(x),而矢量是可以有“方向”这个概念的。因此对矢量场整体进行群变换时,矢量场上的每个点上的f(x)也要发生变换。

标量场和矢量场

在这里插入图片描述
欧几里德群作用在标量场上时,仅把每个像素移动到一个新的位置。与标量场不同的是,对矢量场进行群变换时,每个矢量不仅被移动到一个新的位置,而且还通过动作改变其方向。

特征场的变换律ρ、群表示、诱导表示

相同的群操作 g g g作用在不同的特征场上时,虽然坐标变换 g − 1 ( t − x ) g^{-1}(t-x) g1(tx)是一样的,但是特征场中的元素的变化 ρ ( g ) \rho(g) ρ(g)是不一样的。

在这里插入图片描述
关于群表示的科普,可以查看这个百度文库。

对特征场的变换,也可以用诱导表示(induced representation)来说明:
在这里插入图片描述
在这里插入图片描述

Steerble CNN有多个特征场

在这里插入图片描述
特征场的类型是一种超参数。
在这里插入图片描述

2.3 E(2)-Steerable 卷积

为了保存特征空间的转换律ρ(g),网络的每个层都要求是等变的。

上文中给出了给定类型ρ的特征图在给定群操作下的变换。然而一个卷积=卷积核*特征图,因此下文将探讨卷积核在群操作下的变换。
在这里插入图片描述
上式的“核限制”很关键。如果一个核满足这样的限制,那么就有下面的结果(注意,核限制条件体现在红线的地方):
在这里插入图片描述
由于核约束是线性的,它的解构成了传统CNN所考虑的无约束核向量空间的一个线性子空间。因此,求解G-steerable空间的基就足够了,根据该基,等变卷积可以参数化。受限核空间的低维性提高了可操纵CNN的参数效率,类似于CNNs相对于MLPs提高了参数效率。

  • 9
    点赞
  • 29
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值