datawhale ml learning day2

m0_73649791

于 2024-08-31 23:56:20 发布

阅读量423

点赞数 3

文章标签： machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_73649791/article/details/141761230

版权

学习笔记：

1. 线性模型的基本概念
是什么：线性模型是通过将输入特征（例如前一天的观看次数）与权重相乘，再加上一个偏置项来生成预测值的数学模型。公式可以表示为：`y = wx + b`，其中`w`是权重，`b`是偏置，`x`是输入特征，`y`是输出预测值。

为什么这样用：线性模型的简单性使其成为处理和理解数据的基础工具。它适用于线性关系明显的数据，并可以作为复杂模型的构建基石。

这样做的意义：通过使用线性模型，我们可以快速预测输出值，并通过调整权重和偏置来优化模型，使预测误差最小化。它为进一步的模型优化和扩展提供了基础。

怎么做：在实际操作中，首先需要初始化权重和偏置值，然后通过梯度下降法逐步更新它们，使得损失函数（如均方误差）最小化，从而得到最优的`w`和`b`。

2. 梯度下降法
是什么：梯度下降法是一种用于优化模型参数的算法。它通过计算损失函数相对于模型参数的导数，找到使损失函数值最小的参数。

为什么这样用：梯度下降法被广泛使用，因为它可以有效地处理多维参数空间中的复杂优化问题，尤其是在深度学习中，参数量通常非常大。

这样做的意义：梯度下降法可以帮助模型逐步逼近最优解，减少预测误差。这是模型从初始状态不断改进的重要机制。

怎么做：实际应用时，首先计算每个参数对损失函数的导数，然后按负梯度的方向更新参数。学习率`η`控制每次更新的步长大小，参数更新公式为：`θ1 = θ0 - η∇L(θ0)`。

3. 分段线性曲线与非线性扩展
是什么：分段线性曲线是通过多段线性函数拼接来近似复杂非线性关系的模型。这种方法可以有效应对线性模型的局限性。

为什么这样用：线性模型的局限性在于它只能处理简单的线性关系，而现实世界中的数据往往存在非线性特征。通过分段线性曲线，可以更精确地拟合复杂的非线性关系。

这样做的意义：分段线性曲线扩展了模型的表达能力，使其能更准确地模拟现实数据中的复杂关系，从而提升预测性能。

怎么做：在具体实现中，我们可以通过引入多个特征值，将这些特征值分别乘以不同的权重，然后通过梯度下降法优化这些权重，最终得到一个更符合实际的模型。

4. 激活函数与非线性模型
是什么：激活函数如ReLU和Sigmoid等，是用于引入非线性因素的函数。它们帮助模型处理更复杂的数据关系。

为什么这样用：激活函数可以让模型学习和表示非线性关系，这是许多实际问题中不可或缺的功能。例如，ReLU函数简单且计算效率高，被广泛应用于深度神经网络中。

这样做的意义：通过引入激活函数，模型可以从简单的线性映射发展到复杂的非线性映射，从而更好地拟合实际数据，提升模型的表现能力。

怎么做：在模型构建中，激活函数被应用在每一层神经网络的输出上，使得每一层输出能够作为下一层的输入，从而构建起多层的非线性映射网络。

5. 模型的优化与超参数选择
是什么：模型优化涉及调整模型中的各种参数，使得预测效果最佳。超参数是指在模型训练前需要设定的参数，如学习率、批量大小、ReLU的数量等。

为什么这样用：模型优化和超参数选择是提升模型性能的关键。正确的超参数配置可以显著提升模型的训练效果和预测精度。

这样做的意义：通过合理的优化和超参数调整，模型可以更高效地学习数据特征，减少过拟合或欠拟合的风险，最终提升模型的实际应用效果。

怎么做：具体操作时，可以通过交叉验证等方法选择合适的超参数组合，并通过反复实验来调整模型参数，使得最终模型在测试集上的表现最佳。

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。