1、roidb数据,存放每张图的GT及其分类信息。
格式:
list[
dict 1(for image 1):
{'boxes': (np.array,(N, 4),ground truth框左上角顶点和右下角顶点坐标,从0开始;一图可有多个box),
'gt_classes':(np.array, (N,),每个框类别号,21类),
'gt_overlaps':(np.array, (N, 21),稀疏矩阵,每个框对应的那一类是1,其他是0),
'seg_areas':(np.array, (N,),每个框的面积),
'flipped':False,
'image':当前图像的路径,
'width':图像宽度,
'height':图像高度,
'max_classes':(np.array, (N,), 每个框与overlap最大的类别号,也就是类别标号),
'max_overlaps':(np.array, (N,),全1)}
dict 2(for image 2):{...}