损失函数和优化函数

损失函数和优化函数的重要性:

深度神经网络中的的损失用来度量我们的模型得到的的预测值和数据真实值之间差距,也是一个用来衡量我们训练出来的模型泛化能力好坏的重要指标。

对模型进行优化的最终目的是尽可能地在不过拟合的情况下降低损失值。

损失函数:

1.均方误差函数

均方误差(Mean Square Error)函数计算的是预测值与真实值之差的期望值,可用于评价数据的变化程度,其得到的值越小,则说明模型的预测值具有越好的精确度。计算如下:

其中,ypred表示模型的预测值,ytrue表示真实值,他们的上标i用于指明是那个真实值和预测值在进行损失计算,下同。

2.均方根误差函数

均方根误差(Root Mean Square Error),计算的是均方误差的算术平方根值,其得到的值越小,则说明模型的预测值具有越好的精确度。计算如下:

3.平均绝对误差函数

平均绝对误差(Mean Absolute Error)计算的是绝对误差的平均值,能更好的反映预测值误差的实际情况,其得到的值越小,则说明模型的预测值具有越好的精确度。计算如下:

优化函数:

在计算出模型的损失值之后,接下来需要利用损失值进行模型参数的优化。在实践操作最常用到的是一阶优化函数。包括GD,SGD,BGD,Adam等。一阶优化函数在优化过程中求解的是参数的一阶导数,这些一阶导数的值就是模型中参数的微调值。

梯度的概念:可以参考此博主的博客https://blog.csdn.net/youhuakongzhi/article/details/80565176

1.梯度下降

梯度下降(Gradient Descent)是参数优化的基础方法。虽然已广泛应用,但是其自身存在许多不足,所以在其基础上改进的优化函数也非常多。

全局梯度下降的参数更新公式如下:

其中,训练样本总数为n,j=0....n。θ是我们优化的参数对象,η是学习速率,J(θ)是损失函数,后面的求导是根据损失函数来计算θ的梯度。学习速率过快,参数的更新跨步就会变大,极易出现局部最优和抖动,过慢,梯度更新的迭代次数就会增加,参数更新时间也会变长。

缺点:计算损失值的时间成本和模型训练过程中的复杂度增加。

2.批量梯度下降

假设划分出来的批量个数为m,其中的一个批量包含batch个数据样本,那么一个批量的梯度下降的参数更新公式如下:

缺点:容易导致优化函数的最终结果是局部最优解。

3.随机梯度下降:

假设我们随机选取的一部分数据集包含stochastic个数据样本,那么随机梯度下降的参数更新公式如下:

缺点:会在模型的参数优化过程中出现抖动的情况。

4.Adam

一个比较智能的优化函数方法--自适应时刻估计方法(Adaptive Moment Estimation)。它在模型训练优化的过程中通过让每个参数获得自适应的学习率,来达到优化质量和速度的双重提升。现在一般都选择用这个方法。

  • 8
    点赞
  • 37
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
损失函数优化器是深度学习中非常重要的两个组件,它们在模型训练过程中起着关键的作用。 1. 损失函数(Loss Function):损失函数衡量了模型在训练过程中预测输出与真实标签之间的差异程度。它是一个标量值,用来表示模型的预测与真实值之间的距离或差异。常见的损失函数包括均方误差(Mean Squared Error, MSE)、交叉熵(Cross Entropy)、对数损失(Log Loss)等。损失函数的选择取决于任务类型和模型的输出。 在训练过程中,优化算法通过最小化损失函数来调整模型参数,使得模型能够更好地拟合训练数据,提高预测的准确性。 2. 优化器(Optimizer):优化器是一种用于更新模型参数的算法。它根据损失函数的梯度信息来调整模型参数,以使损失函数达到最小值或局部最小值。常见的优化器包括随机梯度下降(Stochastic Gradient Descent, SGD)、Adam、Adagrad、RMSprop等。 优化器通过计算损失函数关于模型参数的梯度,并根据梯度的方向和大小来调整参数的更新步长和方向。优化器的选择也取决于任务类型、模型结构和数据集大小等因素。 综上所述,损失函数用于衡量模型的预测与真实值之间的差异,优化器则用于根据损失函数的梯度信息来更新模型参数,使得模型能够更好地拟合训练数据并提高性能。它们共同协作,推动深度学习模型的训练和优化过程。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值