前言
box_coder.py主要用于候选边框(proposal)的编码和解码,即求解RCNN论文中回归目标中的以及预测边框。其主要针对的是RCNN和faster RCNN中的Bounding-box regression部分的操作。
1b-box 回归(RCNN)
假设现有获得的候选框(proposal)为, 而基准框(ground-truth)为, 我们需要找一种映射方式使得我们选取出来的候选框能够变换成或者映射到. 针对每一个边框涉及到的x, y, w, h即边框中心坐标的x,y,以及边框的宽和高,我们分别设定有, , , 这四种映射方式,分别可以帮助将的x, y, w, h变换成或者接近的x, y, w, h。
我们设定有, , , 中,和只是尺度方面的变换,即对坐标进行变大或变小以次来移动边框的中心坐标。而针对和采用对数空间的变