https://blog.csdn.net/shayashi/article/details/86506347
ReLU简介:
https://blog.csdn.net/weixin_42147780/article/details/81381674
1.三个3x3感受野的叠加效果等同于一个7x7的感受野,为什么用三个3x3而不用一个7x7?
(1)使用三个非线性修正函数,使得决策函数更可分。
(2)减少了参数数量。假设通道数为C,则三个3x3参数个数为
3(3×3C2)=27C2 。而7x参数个数为(7×7C2)=49C2
2.为什么使用1x1卷积核?
在不影响卷积层的感受野前提下,增加了决策函数的非线性性。