前言:
新人学习笔记,读大佬的文章,结合了自己的理解,不一定正确,欢迎讨论和指正!
1、创新点
PGI 梯度可编程信息
什么是PGI。3个分支:一个主分支,用于推理,一个可逆辅助分支,将梯度信息传递到上一个节点;一个多级辅助分支,进行了一个梯度的融合,整个PGI的设计是为了解决梯度瓶颈的问题,收集更多的梯度信息,同时不增加推理耗时。
GELAN 通用高效层聚合网络
上图中3种结构都是neck,用来做特征的进一步提取的。同时也是梯度回传的重要结构。
CSPNet :通过split将原本的通道分一半出去做梯度传导,解决了Densenet种一半的梯度重用的问题;
ELAN: transiton层比较耗时,且积累了过多的transiton层,这里去掉,同时用类似残差的结构来做;
GELAN:从图中看,就是加回了transition层,将ELAN种的conv操作改成可扩展的block,就是通用名称的来源。