woker9527-CSDN博客

原创学习笔记（十）Faster R-CNN论文

*ROl pooling ：**负责收集proposal 并且计算proposal feature maps ，两个输入（最开始CNN提取的初始feature map 和RPN刚刚生成的Proposal）因为全连接成需要一致的输入特征，这里的proposal大小不同，传统的crop即裁剪会损失完整的结构信息，wrap会破坏图像原始形状，所以使用Rol poling。（4）这样处理后，即使大小不同的proposal输出结果都是pooled_w x pooled_h固定大小，实现了固定长度输出。

2023-10-25 13:23:48 68 1

原创学习笔记 (九) Fast R-CNN论文

再将池化后的向量拉长，并且作为F层的输入，同时输出两个值，一为softmax（即每一类的概率），二为bounding box 回归（即R-CNN中的预测框）最后对输出的得分矩阵使用非极大抑制方法选出少数框，对每一个框选择概率最大的类作为标注的类，根据网络结构的第二个输出，选择对应类下的位置和大小对图像进行标注。然后把一整张图片放入到卷积网络中进行特征提取（此处和R-CNN不同，R-CNN是将2k个候选框中的图像放入其中），获得其特征图，析：主要解决了R-CNN的一些问题。所谈对象：Fast R-CNN。

2023-10-20 20:35:55 70 1

原创学习笔记（八）R-CNN

对于在图片中定位目标，本文采用在候选区域识别的方法，步骤：首先在输入图片上生成大约2000个与目标类别无关的候选区域，然后在每一个候选区域上用CNN提取出固定长度的特征向量，我们用仿射变换从每一个候选区域中计算固定大小 CNN，而不管候选区域的大小，最后用线性SVM对每一个候选区域进行分类。本文的第二个贡献是首先在辅助数据集（ILSVRC）上用有监督的预训练，然后用特定领域的小数据集（PASCAL）进行微调，当数据量很少的时候，这种方式可以有效地训练高精度的CNN。②用少量的带标签数据集来训练模型。

2023-10-16 21:21:53 71 1