深度学习或监督学习的训练是通过梯度下降,和反向传播方法,迭代地去微调神经元中的权重,来使得损失函数最小化的过程,目标检测是典型的监督学习问题,就是说在训练集上肯定有一个人已经用labelme或LabelImg这样的标注软件标注工具,已经画出了一个ground truth,就是这个绿框,人工地去标注出这个绿框,而我们的算法就是要让这个预测结果尽量拟合这个绿框,使得损失函数最小化,关于损失函数怎么构建,后面会有专门讲解。
这个绿框就称为ground truth,是标准答案,而这个绿框的中心点落在哪个grid cell里面,就应该由哪个grid cell预测出的bounding box去负责拟合这个绿框,每一个grid cell预测出两个bounding box,那么就应该由这两个bounding box中的一个去负责拟合这个绿框。
总结:
在深度学习领域,Ground Truth (常用英文表示,中文意思是「地面真实值」或「基准真实值」,简单理解就是真实值) 是指用于训练和评估模型的准确标签或数据。 Ground Truth 用于评估 ML 模型的性能以及训练和验证模型。
例如,如果正在开发 ML 模型来对动物图像进行分类,则基本事实将是每个图像的正确标签,例如「猫」、「狗」或「鸟」。该模型将在包含图像及其相应地面真实标签的数据集上进行训练,并且将根据其预测新的、未见过的图像的正确标签的准确程度来评估其性能。
特别是对于大型数据集,获取真实标签可能是一个耗时且耗力的过程。它经常需要手动检查和注释数据集中的每个案例,这可能需要大量时间。在某些情况下,可以使用自动化方法建立真实标签,但这些程序可能不太可靠,并且需要更多的手动评估和纠正。
Ground Truth 是机器学习的关键要素,因为它提供了比较 ML 模型性能的标准。它也是许多机器学习任务的关键要素,例如监督学习,其中模型使用真实标签进行训练和验证。相反,在无监督学习中,模型必须学会在没有任何明确指示的情况下识别数据中的模式和相关性,因为 Ground Truth 标签可能无法访问。