1. 选择部分标签用作训练集
把当前框内标签的比例作为选择的指标。
2. 选择全部标签用作训练集
3. 考虑图像聚类来选择标签
聚类效果太差了,没采用。
4. 降低数据集的分辨率来训练
考虑之前是否是因为分辨率过高,导致特征提取不够好。
5. 实验结果
6. 利用特征提取判断标签质量
这里只列举了一张图像的各个类别。找出所有图像各个类别的共性(特征提取),然后通过离群点检测来判断原始标签是否标注正确。
问题:这样只能判断原始标签里哪些正确,并不能判断背景中有哪些没标注(训练中主要以滑动窗口的形式裁切原始图像,因此会使得背景中的内容也参与训练。)