图片分类
随着参数增加,模型弹性也会增加,也增加了Overfitting的风险
问题一:
怎样把图片当作模型进行输入,怎样避免使用太多的参数
**Step1 **
- a neuron 不需要看整张图片,分辨出几个重要的特征
Step2 Simplification
Typical Setting
其中kernel size代表长*宽,没有高
- receptive field是有交集的部分
- 超出边框范围的是padding
简化Fully Connected Network的方式
问题二
同样的pattern可能出现在图片不同区域,解决这个问题是共享参数
Typical Setting
总结
大一点的模型偏差不一定是坏事
2 another story introduces CNN
-filter1进行计算
问题三:pooling–Max pooling
- 主要目的是减少运算
整个CNN
CNN并不能处理图片放大缩小,旋转的问题 Spatial Transformer Layer