- 1. 图片预处理
- 2. RPN网络预测
- 3. RPN to ROIs
- 4. Classifier 网络预测
- 5. Classifier网络输出对 ROIs过滤与修正
6. NMS (非最大值抑制)
- 7. 坐标转换为原始图片维度
一: 输入输出
输入:
- candidate_bboxes: shape 为 [M, 4]
- candidate_probs: shape 为 [M, ]
输出:
- bboxes_on_resize: VGG16图片输入维度下的bbox, shape为 [M, 4] N 表示未知
- result_probs: 最终boxes的概率, shape为 [M, ] M 表示未知