这篇论文是2014 CVPR上的,是本人看的目标检测领域的第一篇论文,当时看的时候有很多不太理解的地方~
1.动机
2.贡献点
优势:
1.共享。CNN对于每个分类的参数都是共享的
2.低维。与其他方法相比,4096维的特征向量算是很小的了
特点:
1.可视化学习
2.经过fine-tunning卷积层提取出来的特征具有普遍性,而全连接层的有针对性,可用于迁移学习
3.网络架构采用O-Net
3.方案
4.实验方法和结果
5.一些概念
5.1有监督预训练与无监督预训练
有监督预训练: 从给定的训练数据集中学习出一个函数(模型参数),当新的数据到来时,可以根据这个函数预测结果。监督学习的训练集要求包括输入输出,也可以说是特征和目标。训练集中的目标是由人标注的。
无监督预训练: 通俗点将就是实际应用中,不少情况下无法预先知道样本的标签,也就是说没有训练样本对应的类别,因而只能从原先没有样本标签的样本集开始学习分类器设计。
5.2 IoU的定义
两个矩形框A、B的一个重合度IoU计算公式:
IoU=(A∩B)/(A∪B)
5.3 非极大值抑制
顾名思义就是抑制不是极大值的元素,搜索局部的极大值。这个局部代表的是一个邻域,邻域有两个参数可变,一是邻域的维数,二是邻域的大小。
5.4 hard negative mining method
hard negative mining method is when you take that falsely detected patch, and explicitly create a negative example out of that patch, and add that negative to your training set.