ground truth
参考:https://www.zhihu.com/question/22464082
说白了,就是标准答案,真实值,设定的一个正确的基准。有监督学习中,输入的训练数据会有相应的ground truth(真实值,标签),在计算loss的时候,需要将预测值和这个真实值进行对比从而计算距离。Ground truth当然还可以用来做reinforcement learning,就是在学习中加入奖励机制。比方说程序的输出越接近ground truth,用来产生这个结果的数据的weight越大。