全球人工智能技术创新大赛【热身赛一】baseline改进的思路(只是思路,因为目前没时间搞,可能搞了也搞不出来~
1、首先是类别不均衡的问题(论文可以参考A systematic study of the class imbalance problem in convolutional neural networks)这个肯定是要首要解决的
即使Pytorch中已经有很多线上的数据增强方式,但是线上的增强方式会导致目标检测box的变化,而线下的方式可以直接修改box的坐标,从而达到更好的效果
目前的思路是这样:
因为一张图片中可能有多个瑕疵的部分,所以要找出真正包含类别不均衡问题瑕疵的图片的个数以及其图片,
比如json中错花的地方有327个,但是实际包含错花的图片个数只有31个,对这31个图片进行水平或者垂直翻转,能得到很多图片
再将图片的json文件写入,进行预处理既可以
2、YOLO V5的特征融合使用的是PANET,而谷歌的EfficientDet表示BiFPN是更好特征提取方案,这个如果能改的话应该更好
目前的话就这么多~