看到面经上有这个问题,思考了一下,我觉得答案有两个:
1. 我们知道,RPN在计算位置回归loss的时候其实是计算①预测框与anchor的偏移t 与 ②真值框与anchor的偏移t* 这二者的偏差,而不是直接求预测框和真值之间的偏差。t-t*趋近0时,预测框就趋近于真值框。
以w为例,
那么,
于是,log操作就将anchor参数消除了
2. Bound Box Regression可以看做是对预测框和真值框做线性变换进行位置精调,那么
为什么 可以看做是线性的呢?
这是因为
而
所以,只有当w*和w趋近时,才能视为线性变换。所以要求IoU大于0.7.