对目标检测,需要把物品用矩形框选出来
分割要每一个像素都要区分
CIFAR-10:高级的数据集,彩色
专业数据集:
AlexNet CV方向突破,ZF是小修小补
网络介绍:
上下两部分的原因:当时显卡放不下,买了两片
第二个卷积层
接下来三个卷积层,没有马上接池化,扩展像素,保证不变
可能大变化,常见噪声,增加鲁棒性
思考角度:不一定用大卷积核,但希望效果没事,发现小核做深,效果更好
去搜!!!!:(感受野)
感受野:下面的5x5都能影响到最上面那个,深度加深,参数量却少了
参数良很大
googlenet:提出Inception和Bottleneck
Inception:
平时用到的卷积滤波器,一般都是一样的,但:应该用很多不同的,这样特征更好
参数少了,256个滤波器,1x1的滤波器可以随意降低通道数
参数量巨大,但右侧Google就通过一种方法没有参数了
微软搞得:ResNet当年cvpr最佳
网络非常深的时候,梯度很不稳定,残差结构:有时跳过去,直接相加
首先用52层的无跳跃还不如20层的
搞了些跳跃连接,就不错了
加深后,梯度不可预测,所以要想办法控制,为什么有效?有很多流派
1132:bottlenet作用,通道数很大,参数太多,所以用改卷积核降下来,再升上去,参数就少了
多少个滤波器,能决定,深层的channel数
怎么挑:先找到,pre训练,再微调
最近efficientNet
神经网络:
1.训练:训练时要很多,很大内存
2.推理:很快,很少
后面实践:
口罩识别:
看回放吧