最近顾着在源码架构上下功夫,现在回过头来发现自己在图像标注上存在不少问题,重新了解了一遍标注上的原则后,进行一个规范设计的假象
最早我训练坏了的模型,恰恰就是因为在标注的时候使用了旋转了90°的图片,然后才发现这样标注是不会识别出正向的。
类似这种的
如果以这种图片去训练的话是不能识别出正向的照片的。
但是用户拍照过来的也不一定是正的,因此这里有个坑要解决
也就是说,我们需要在四个旋转纬度都要标注
然后测试过斜着拍也是能识别的,这部分的话就不用担心
然后网上查找了一下相关的资料,除了在训练参数上修改外,标注上也有一定的方法规则可以提升准确度
这里参考了这个链接:
目标检测标注原则
总结起来就是,如果仅仅追求素材的数量而不顾素材标注的质量,即使数量再多,也没有效果,实践证明,模型效果反而越来越差。
1、要框的对,框的准,大小合适。
2、目标被遮挡也要标注。
3、人眼都不认识的就不要去标(比如图太糊,遮挡过大等)
4、不要光追求速度,要注重质量以及要人工审核有无标错,写错label
以及团队讨论得出的一些提高标注质量的想法
一张图里有多个报错截图,提高区分度
一个图多标,进行多步区分
还有什么建议可以评论区提出,日后有其他想法也会添加进去