Mask-RCNN(3) : 自定义数据集读取(VOC &COCO)以及pycocotools的使用
按照3个一组进行划分,前2个值代表关键点的x,y坐标,第3个值代表该关键点的可见度,它只会取。0表示该点一般是在图像外无法标注,1表示虽然该点不可见但大概能猜测出位置(比如人侧着站时虽然有一只耳朵被挡住了,但大概也能猜出位置),2表示该点可见。它的boundingbox信息,可以知道它对应的是分割图片上的红色目标,红色目标它的像素值都是1,刚好。同理第二个目标小飞机,对应分割区域的像素值都是为2的,同理目标3,目标4也是这样。,以上图的标注文件为例,总共标注了4个目标(目标1,目标2,目标3,目标4)。
复制链接