机器学习task03误差与梯度下降

本文深入探讨了模型训练中的误差来源,包括偏差(Bias)和方差(Variance)的影响,以及如何通过调整模型复杂度和增加数据来改善。此外,还介绍了梯度下降的重要性,学习率的调整,以及如AdaGrad等自适应学习率算法,以优化模型的收敛速度。同时,特征缩放也被提及,作为加速训练过程的一种手段。
摘要由CSDN通过智能技术生成

误差

在训练集训练模型时,尽可能让Loss最小。但是,当我们把训练好的Model用于Test时,会出现误差。误差与模型的选择、训练集的数据量都有关系。本节内容探讨了:1、误差的两种成分,Bias和Variance;2、实际工程里的一些建议。

误差ppt截图

1,展示偏差和方差区别
在这里插入图片描述
2,Bias比较大的常见情形(Underfitting)——模型过于简单。改进建议:增加模型的复杂度。
在这里插入图片描述
3,Variance比较大的常见情形(Overfitting)——模型过于复杂、数据太少。改进建议:a、增加Data;b、Regularization。
在这里插入图片描述

梯度下降

主要介绍了梯度的理论基础——泰勒展式,确切说并非准确的理论。

梯度ppt

1,Learning Rate很重要,要跟踪Loss function的变化,以确定rate是合适的。
在这里插入图片描述
2,有一些Adaptive的算法,其中最为简单的是Ada算法。
在这里插入图片描述
3,随机梯度下降法。
在这里插入图片描述
4,Feature Scaling。也是为了收敛的更快。
在这里插入图片描述
5,梯度下降理论
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
机器学习中,公式推导和代码实现是非常重要的部分。公式推导可以帮助我们理解算法的原理,而代码实现则是将算法应用到实际问题中的具体步骤。 在公式推导方面,我们可以使用神经网络作为例子。神经网络是一种用于解决分类和回归等问题的机器学习模型。它可以通过前向传播和反向传播来进行训练和预测。 在前向传播中,神经网络根据输入数据和权重参数计算出预测结果。具体来说,我们可以使用一系列的线性变换和激活函数来计算每个隐藏层和输出层的值。通过不断传递数据和权重,我们可以得到最终的预测结果。 在反向传播中,神经网络根据预测结果和真实标签之间的误差来更新权重参数。这个过程可以使用梯度下降法来实现。我们首先计算出损失函数对于每个权重的偏导数,然后根据偏导数的方向来更新权重。 具体的推导过程可以参考引用中的文章。文章中详细介绍了神经网络的公式推导和参数更新的推导过程。 在代码实现方面,我们可以使用Python来手动实现神经网络。可以使用NumPy等库来进行矩阵运算和激活函数的计算。具体的代码实现可以参考引用中给出的示例代码。 综上所述,机器学习的公式推导和代码实现是我们理解和应用算法的重要步骤。通过推导公式和实现代码,我们可以更深入地理解算法的原理,并将其应用到实际问题中。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [机器学习之神经网络的公式推导与python代码(手写+pytorch)实现](https://blog.csdn.net/qq_52785473/article/details/127454390)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值