CS231N–迁移学习之分割、定位与检测
一、概念定义:
语义分割将图像不同层次都用轮廓分割出来,实时分割问题更多的是多任务问题,在不同层次上实时的进行图像分割。
分类与定位,分类问题简单的降图像中识别的物体种类输出,定位给出不同物体所在图片中的坐标,可能需要标注框来框出物体所在目标,而分类+定位问题就是两者皆有
目标检测,与分类问题进行比较,主要区别是多物体分类与定位,解决地问题可能更复杂。
不同的图像任务所需的网络架构不同,分类+定位——目标检测——语义分割,问题困难程度不断加深。
二、分类与定位
1. 基本分类与定位
将分类定位问题看成一个回归问题,使用L2范数欧式距离来计算损失函数。
下载别人已经前训练过的模型(AlexNex、VGG、GoogleNet),当然自信有时间有装备也可以自己训练模型。得到class scores的全连接层,分类层得到C类。
新建一个回归层(regression head),其实也是全连接层,输出类所在的位置框。
然后通过一张张图像的训练,最后完成分类与定位的训练。
回归有两类回归:不定类回归(class-agnostic regresar)