解决的问题:EAST算法输出的有一个叫score map的东西,这个东西中间的像素都是用来定位框的,假如score map有100100大小,那么输出的框就有1W个,一般通用检测框架输出的框就几十个,多则上百不得了了,所以它们不需要特别的框处理方法,但是在EAST中不做一写特别处理就会面临O(n2)的复杂度,直接上1W1W的时间复杂度
解决方法:先过一次框的merge,再NMS
作者认为相邻的几何体(此处用几何体是因为EAST不仅能处理AABB(axis-aligned bounding box)也能处理任意四边形)都是具有高度相关的,所以可以先合并
// merge
float p_s = out[p_given + 9];
for (int v = 0; v < 4; v++) {
out[ref+v*2+1] = (out[ref+v*2+1]*score_t + out[p_given+v*2+1]*p_s) / (score_t + p_s);
out[ref+v*2+2] = (out[ref+v*2+2]*score_t + out[p_given+v*2+2]*p_s) / (score_t + p_s);
}
score_t += p_s; // update the total score
CUDA代码,(rectangle1.x1score1+rectangle2.x1score2)/(score1+score2)
这个地方的score就是个权值
python代码
def weighted_merge(g, p):
g[:8] = (g[8] * g[:8] + p[8] * p[:8])/(g[8] + p[8])
g[8] = (g[8] + p[8])
return g