Simple-Faster-RCNN 源码学习
项目github地址: https://github.com/chenyuntc/simple-faster-rcnn-pytorch
源码
源文件: model/utils/bbox_tools.py
方法: loc2bbox(src_bbox, loc)
参数含义:
- src_bbox描述的是bbox的坐标.
- loc表示的偏移(offsets)和缩放尺度(scales).
给出边界框的偏移及缩放尺寸,该函数将表示转换为2D的图像坐标.
即通过对原边界框src_bbox附加上loc对应的变换,从而得到新的边界框.
先将坐标表示法src_bbox转换成中心表示法 p x , p y , p w , p h p_x,p_y,p_w,p_h px,py,pw,ph
再结合loc数组中的偏移和缩放 d x , d y , d w , d h d_x,d_y,d_w,d_h dx,dy,dw,dh
根据如下公式,做转换并得到 g x , g y , g h , g w g_x,g_y,g_h,g_w gx,gy,gh,gw