在训练模型第一阶段过程当中,我们是使用有标签样本进行训练,在线性回归当中我们也可以看到,有很多点并不是直接通过了直线,让我们来看一下这张数据图表。
线性回归
我们可以看到,有一些点是没有通过直线的,机器学习的算法是通过检查多个样本并尝试找出最大限度地减少损失的模型。这一过程我们称之为经验风险最小化。损失是一个值,表示对单个样本而言模型预测的准确程度。如果模型预测的完全准确,那么损失就为零,否则损失就会较大。训练模型的目标是从所有的样本中找到一组平均损失较小的“权重”和“偏差”。让我们来看一下下面的图,红色表示损失,蓝色表示预测。