这样避免显式的添加结构先验,导致模型复杂,泛化能力低。目前大部分方法基于大感受野:扩大池化,增加卷积核,累加卷积层。但是过大的池化会牺牲精度,如果通过反卷积还原精度会添加额外信息。不断累加卷积层代价是梯度消失。增大卷积核相当于增加参数量,增加计算量。
成熟的设计思路包括,顺序卷积结构和基于沙漏网络结构。
1、顺序卷积结构:卷积姿态机:CPM
多阶段级联(cascaded)的深度网络,采用11x11大卷积核不断的累加卷积操作。
采用了中间监督训练(Intermediate supervision),将各个阶段产生的heatmap和ground truth产生的误差累加起来作为总误差进行迭代,同时将梯度从各个网络的输出层反向传播,避免梯度消失。
参考:https://blog.csdn.net/mpsk07/article/details/79522809#1网络结构