伪标签技术作为一种半监督学习的方法,当在训练的数据集不足的场景下伪标签技术发挥着重要的作用,伪标签技术一个重要的应用场景是在kaggle比赛中,往往kaggle的比赛给出的训练数据集较少而测试的数据集较多,训练集较少容易导致模型过拟合,利用伪标签技术对测试集数据进行标签可以实现快速的扩增训练集,因此伪标签技术成为kaggle比赛的一大利器。
接下来我将从目前我正在参加的kaggle比赛(Global Wheat Detection)全球小麦头检测来分析伪标签技术在目标检测中的作用
比赛链接:https://www.kaggle.com/c/global-wheat-detection
赛题描述:
这里还是先介绍一下小麦头检测的比赛的内容:
比赛链接:https://www.kaggle.com/c/global-wheat-detection/overview/code-requirements
比赛背景:主要是准确估计算出不同品种的小麦头的密度和大小,从而帮助农民评估自己的农作物
在本竞赛中,您将从室外的小麦植株图像(包括来自全球的小麦数据集)中检测出小麦植株的头部。使用全球数据,您将专注于通用解决方案,以估计小麦头的数量和大小。为了更好地评估看不见的基因型,环境和观察条件的性能,训练数据集涵盖了多个区域。您将使用来自欧洲(法国,英国,瑞士)和北美(加拿大)的3,000多张图像。测试数据包括来自澳大利亚,日本和中国的约1,000张图像。目前比赛还有二十三天结束有兴趣的小伙伴可以去参加。