深入了解机器学习:训练与损失
训练模型 通过有标签样本学习并确定 所有权重和偏差的理想值
经验风险最小化: 监督式学习中,算法通过以下方式构建模型
检查多个样本并尝试找出可最大限度地减少损失的模型
损失 是对糟糕预测的惩罚
① 一个数值,表示 单个样本 对模型预测的准确程度
② 模型预测完成准确,则损失为零,否则损失会较大
训练模型的 目标:
从所有样本中找到一组平均损失 “ 较小 ” 的权重和偏差
eq.
从两张图中可知,第一张图损失较大,第二张图损失较小
一图 红色箭头 比 对应的二图 红色箭头 长很多,所以损失显然易见
平方损失:一种常见的损失函数
单个样本 的平方损失如下:
= the square of the difference between the label and the prediction
= (observation - prediction(x))2
= (y - y')2
均方误差(MSE)
每个样本的平均平方损失
请求各个样本的所有平方损失之和,然后除以样本数量
(x,y) 指的是样本,x 指的是模型进行预测时使用的 特征集
y 指的是样本的 标签
prediction(x) 指的是 权重和偏差 与 特征集 x 结合的函数
D 指的是包含多个 **有标签样本(即(x,y))**的 数据集
N 指的是 D 中的 样本数量
MSE 常用于机器学习,虽然不是唯一实用的损失函数,也不是适用于所有情形的最佳损失函数