roidb是由字典组成的list,每张图片对应一个字典,roidb[img_index]包含了该图片索引所包含的roi信息,下面以roidb[img_index]为例说明:
box_num:一幅图片中所包含的box数量
class_num:分类所包含的种类数量
| roidb[img_index]包含的key | value |
| boxes | box位置信息,box_num*4的np.array |
| gt_overlaps | 所有box在不同类别的得分,box_num*class_num的矩阵 |
| gt_classes | 所有box的真实类别,box_num长度的list |
| flipped | 是否翻转 |
| image | 该图片的路径,字符串 |
| width | 图片的宽 |
| height | 图片的高 |
| max_overlaps | 每个box在所有类别的得分最大值,即gt_overlaps行最大值,box_num长度 |
| max_classes | 每个box的得分最高所对应的类,box_num长度 |
| bbox_targets | 每个box的类别,以及与最接近的gt-box的4个方位偏移 |
参考:
1259

被折叠的 条评论
为什么被折叠?



