在看神经网络方面的文章时,文中有很多专业名词,在网上看了大家的理解后记录于此。
AP(average precision)平均正确率
一种衡量结果的标准。
FPN(feature pyramid networks)特征金字塔网络
原来多数的object detection算法都是只采用顶层特征做预测,但我们知道低层的特征语义信息比较少,但是目标位置准确;高层的特征语义信息比较丰富,但是目标位置比较粗略。另外虽然也有些算法采用多尺度特征融合的方式,但是一般是采用融合后的特征做预测,FPN不一样的地方在于预测是在不同特征层独立进行的。
ResNet(residual network)残差网络
为解决“随着网络加深,梯度消失的现象越来越明显,准确率下降”的问题。
Resnet提供了两种选择方式,也就是identity mapping和residual mapping,如果网络已经到达最优,继续加深网络,residual mapping将被push为0,只剩下identity mapping,这样理论上网络一直处于最优状态了,网络的性能也就不会随着深度增加而降低了。
分割误差
分割误差为mask rcnn中新加的。mask rcnn中的损失函数为分类误差+检测误差+分割误差。
对于每一个m*m大小的ROI区域,mask分支有一个K*m*m维的输出,K是指所有的类别(例如PASCAL VOC一共20个类