一、模型创新点
模型改进:rpn网络部分加入了K-means聚类算法,对框的大小聚类,并输入rpn网络
二、faster-rcnn特点
1.1区域建议网络
1、传统的区域建议框选择
方法:selective search
局限性:产生的建议框有相互叠加的,增加了计算量
2、faste-rcnn
方法:rpn(region proposal network)
原理:卷积后提取的特征图与原图位置相对应,将feature maps作为rpn网络的输入,并在每一张特征图每个元素上产生9个大小不同的anchors box,
模型特点:共有两个卷积网络
(1)一个是11卷积核18维的卷积运算,判断该anchors
box是否是前景图像
(2)一个是11卷积核36维运算,得到该anchor相对于
原图的ground truth的相对坐标
1.2感兴趣区域池化(roi pooling)
将候选区域映射到特征图上,将每一块按照水平和垂直分为7份,将每个块按照最大池化法处理,输出7x7的大小,实现固定大小输出。
1.3分类
分类部分得到的特征向量,经过全连接和softmax进行计 算 和 分 类,看每一个区域属于哪一个种类,并且输出属于这个种类的概率为 多 少.然后再次通过边框回归,得 到 这 个 区 域 与 真 实的 GT位置的偏移量,用于之后的回归,使得目标检测框更加接近真实位置.
1.4非极大值抑制
作用&