R-cnn,Fast Rcnn
输入层设置
特征输入分别输出到两个并行的全连接层,即传统意义上的,分类+回归
- cls_score层:分类层,输出K+1维的数组, pi p i 表示是分类还是背景的概率
- bbox_predict层: 候选框需要调整层,输出4*K维数组,表示属于第K类时应该缩放平移的参数
Loss fuction
- loss_cls : 对分类进行评估,采用真实分类概率决定: Lcls=−logpu L c l s = − l o g p u
- loss_bbox:对bbox定位进行评估,用于比较真实分类对应的预测参数 tu t u 和真实平移缩放参数为 v v 的差别: