一、roidb
roidb是一个list,里面包含了很多roi(一张图片的信息)。roi是dict类型,一张图片的信息
1.1 roi初始的key
- boxes: 所有的fine-scale proposal的x1,y1,x2,y2
- 1000* 4. 假设有1000个proposal
- gt_classes: 类别, 其实是恒为1
- 1000*1
- gt_ishard: 都是0
- 1000*1
- gt_overlaps: 相当于onehot编码的ground truth
- 1000*2
- flipped: False
- 标量
- seg_areas: proposal的面积
- 1000*1
1.2 roi在prepare_roidb时,又添加的key
- image: 图片的完整路径
- width:图片的宽度
- height:图片的高度
- max_classes:每个fine-scale proposal的类别编号
- 1000*1
- max_overlaps: 全是1
- 1000*1