发现问题:
深层网络训练的效果反而不如浅层网络效果
解决办法:
一方面更深卷积,另一方面要对未卷积之前的进行映射
(个人理解即相当于未进网络的图片分成两条路一条走网络,一条直接拿过来,可以通过训练对两条路的训练效果进行比较调整比重,保证训练的结果至少不比未经网络之前的差)
Resnet网络中体现:
每个模块都要相上述方法两条路进网络,对于特征图数不同的,我们可以进行卷积操作来增加特征图数量(要求:两条路最终输出格式必须完全相同,可以用1x1xC的卷积核)
发现问题:
深层网络训练的效果反而不如浅层网络效果
解决办法:
一方面更深卷积,另一方面要对未卷积之前的进行映射
(个人理解即相当于未进网络的图片分成两条路一条走网络,一条直接拿过来,可以通过训练对两条路的训练效果进行比较调整比重,保证训练的结果至少不比未经网络之前的差)
Resnet网络中体现:
每个模块都要相上述方法两条路进网络,对于特征图数不同的,我们可以进行卷积操作来增加特征图数量(要求:两条路最终输出格式必须完全相同,可以用1x1xC的卷积核)