检查自己数据发现,左上角坐标(x,y)可能为0,或标定区域溢出图片
而faster rcnn会对Xmin,Ymin,Xmax,Ymax进行减一操作
如果Xmin为0,减一后变为65535
问题解决
1、修改lib/datasets/imdb.py,append_flipped_images()函数
数据整理,在一行代码为 boxes[:, 2] = widths[i] - oldx1 - 1下加入代码:
for b in range(len(boxes)):
if boxes[b][2]< boxes[b][0]:
boxes[b][0] = 0
2、修改lib/datasets/pascal_voc.py,_load_pascal_annotation(,)函数
将对Xmin,Ymin,Xmax,Ymax减一去掉,变为:
3、(可选,如果1和2可以解决问题,就没必要用3)修改lib/fast_rcnn/config.py,不使图片实现翻转,如下改为:
# Use horizontally-flipped images during training?
__C.TRAIN.USE_FLIPPED = False
我们推荐前两个解决方法。第3种方法有点霸王硬上弓的意思,问题是解决了,但会影响训练性能。