系统流程图:
目标函数:
里面用到的小trick:
(1) 训练样本挑选,选取正样本时候考虑多样性,选取负样本时候考虑与正样本的相似同时可区分,这样的用意是使得分隔超平面更加精确.首先superpixel中挑选了较清楚的60正样本和120负样本,训练字典过程中自动挑选后,扩充到180正样本和1080负样本.
(2)计算效率改进:训练和测试旋转样本,为什么训练阶段也要分割呢,作者其实有从superpixel中人工挑选了较清楚的60正样本和120负样本,然后剩余的让程序迭代挑选,正样本时候考虑多样性,选取负样本时候考虑与正样本的相似同时可区分:
文中细节:作者认为预测对为ground truth和boundingbox 完全重合,如果覆盖多个框也只算一个,而且其余算false positive,算挺严格的评估,所以图像分割的破损率提高会导致false positive增多,精确度下降,奇怪的是为什么不用极大值抑制来过滤重合的车子,因为极大值抑制对密集的车辆容易漏测,而作者没有采用可能也是出于这个原因.论文中验证了sift特征不如hog特征.