图片,CNN,特征图,RPN,两个分类器。RPN:33的卷积核,然后一个像素对应9个先验框(3个尺度、3个比例),然后ROI池化(比如一个区域建议得到四个元素的特征向量,一个区域建议分成四大块,一大块中的最大值),特征向量输入两个分类器,一个是回归框损失一个是类别损失。比如一个256256的图片,到16*16的特征图,然后再一个值对应九个先验框。在后向传播时根据标签调准预测。
Faster RCNN的一些小了解
最新推荐文章于 2022-11-10 18:18:22 发布
图片,CNN,特征图,RPN,两个分类器。RPN:33的卷积核,然后一个像素对应9个先验框(3个尺度、3个比例),然后ROI池化(比如一个区域建议得到四个元素的特征向量,一个区域建议分成四大块,一大块中的最大值),特征向量输入两个分类器,一个是回归框损失一个是类别损失。比如一个256256的图片,到16*16的特征图,然后再一个值对应九个先验框。在后向传播时根据标签调准预测。