一、图像识别与定位
0.Classification:C个类别
Input:Image
Output:类别标签
Evaluation metric:准确率
1.Localization:
Input:Image
Output:物体边界框(xy,w,h)
Evaluation mertric:交并准则
3.Classification+Localization:识别主题+定位
4.ImageNet:实际上有 识别+定位 2个任务
5.思路1:视作回归问题
(1)先解决简单问题,搭建一个识别图像的神经网络
(2)在AlexNet VGG GoogleLenet ResNet上fine-tun一下
(3)步骤2:在上述神经网络的尾部展开,称为classification+regresssion模式
(4)步骤3:回归部分(Regression)用欧氏距离损失;使用SGD(随机梯度下降)训练
(5)Regression(回归)的模块部分加在什么位置
最后的卷积层后;全连接层后