李宏毅ML 学习笔记（1）

夹心蛋挞

已于 2024-07-07 14:16:48 修改

阅读量358

点赞数 10

文章标签：学习笔记机器学习

于 2024-01-09 14:05:32 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kiyomioo/article/details/135456561

版权

课程链接：(强推)李宏毅2021/2022春机器学习课程

目录

1、什么是机器学习？

2、任务类别？

3、机器如何形成函数？

误差loss表示？

4.减小Model bias？使用激活函数改写Model

1.sigmoid function

2.Rectified Linear Unit（ReLU）

5.数据集分割?

6.训练集、验证集、测试集

附：一些概念

1、什么是机器学习？

机器学习就是让机器具有寻找一个函数的能力

2、任务类别？

输入可以为vector向量、Matrix矩阵、Sequence序列

Regression：输出一个scalar（数值）

Classification：给出classes，输出一个选项

Structured Learning：输出一些结构化的东西（图像、文件等）

3、机器如何形成函数？

第一步：选择带有未知参数的Model

其中未知参数包括bias（偏差）、weight（权重）等

第二步：定义loss

计算label（ $y\widehat{}$ ）与预估值（ $y$ ）之间的差异e
构建Error Surface（维数取决于Model中未知参数数量）

误差loss表示？

均值绝对误差MAE = $\frac{1}{n}\left |y-\widehat{y} \right |$

均值方差MSE = $\frac{1}{n}\left ( y-\widehat{y} \right )^{2}$

第三步：优化未知参数

使用梯度下降法让w，b逼近loss的局部极小值

随机初始化w0
更新w，步伐大小为 $\eta \frac{\partial L}{\partial w} \bigg|_{w=w^0}$ （ $\eta$ 为超参数learning rate）

即下一步为 $w^{1} \leftarrow w^{0} - \eta \frac{\partial L}{\partial w} \bigg|_{w=w^{0}}$

注：

1. 梯度是一个向量，它指向损失函数增加最快的方向。我们希望最小化损失函数，因此需要沿着损失函数的梯度下降方向，也就是梯度的反方向更新权重，从而最小化损失函数

2. 学习率 η控制每次更新的步长。如果学习率过大，可能会导致更新步幅过大，错过最小值；如果学习率过小，收敛速度会变慢。因此，通过合适的学习率和沿梯度的反方向更新，模型能够有效地收敛到最小值。

反复操作，直到达到更新次数阈值或在该参数点梯度为0

4.减小Model 拟合误差？使用激活函数改写Model

激活函数使神经网络能够学习和表示复杂的非线性关系。如果没有激活函数，神经网络只能执行线性变换，无论网络有多少层，其输出仍然是输入的线性组合。通过引入非线性，网络能够更好地拟合数据的复杂分布，从而减少过度简单的线性模型可能带来的误差。

1.sigmoid函数

Sigmoid 函数是一种类型为曲线函数的数学函数，通常用于将输入值映射到 0 和 1 之间的输出值。Sigmoid 函数的数学形式为：

$\sigma(x) = \frac{1}{1 + e^{-x}}$

Sigmoid 函数的输出范围是 (0, 1)

通常Sigmoid函数是逼近硬Sigmoid函数，分段线性函数由 常数constant与一组硬Sigmoid函数组成。

利用多条分段线性函数可以逼近任何曲线

2.Rectified Linear Unit（ReLU）

两个ReLU函数可以表示一个Sigmoid函数

5.数据集分割?

dataset可以分成多个batch，batch size为一个batch中的data数量

根据每个batch可算出对应loss，使用梯度下降法更新参数为一次update

所有batch都被update过称为一个Epoch

6.训练集、验证集、测试集

关系：training过程中使用训练集去优化模型，验证集来检验模型的有效性，经过反复迭代，最终根据测试集来预测结果

形式：通常训练集与验证集是由dataset划分而来

附：一些概念

local minima局部最小值和global minima全局最小值

过拟合：是指模型只过分地匹配特定数据集，以至于对其他数据无良好地拟合及预测。其本质是模型从训练数据中学习到了统计噪声。

超参数：控制参数的参数，包括学习率lr，sidmoid函数数量，batchsize，神经网络层数layer等

关注

10
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
李宏毅ML 学习笔记（1）

李宏毅2021/2022 ML课程学习
复制链接

扫一扫

夹心蛋挞 CSDN认证博客专家 CSDN认证企业博客

码龄2年

4: 原创

141万+: 周排名

12万+: 总排名

2160: 访问

: 等级

112: 积分

42: 粉丝

60: 获赞

2: 评论

51: 收藏

私信

关注

热门文章

最新评论

李宏毅ML 学习笔记（3）
CSDN-Ada助手: 恭喜您写下了第三篇博客！标题听起来很有趣，我非常期待阅读您的学习笔记。您一直保持创作的劲头真是令人钦佩。在下一步的创作中，也许您可以考虑分享一些具体的机器学习应用案例，这将进一步丰富您的博客内容。谦虚地说，我相信您将继续取得更多的进步，并且成为一个备受关注的机器学习领域博主。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
李宏毅ML 学习笔记（2）
CSDN-Ada助手: 非常感谢您的第二篇博客！看到您持续写下去真是令人鼓舞！您的标题和摘要显示了您正在学习李宏毅教授的2021/2022 ML课程，这是一个非常有价值的学习资源。除了您已经提到的李宏毅的课程，我想分享一些与您的博文相关的扩展知识和技能。在深度学习领域，了解并掌握常用的深度学习框架，如TensorFlow和PyTorch，将使您能够更好地实现和部署机器学习模型。此外，了解数据预处理和特征工程的技巧也将对您的学习和应用有所帮助。同时，您还可以关注最新的机器学习研究动态，了解领域的前沿进展和最新技术。此外，了解一些与机器学习相关的数学基础，如线性代数、概率论和优化方法，对您理解和应用机器学习算法也会有所帮助。再次恭喜您的持续创作！期待看到更多关于您在李宏毅教授的ML课程中学到的知识和经验的分享。祝您在机器学习的学习道路上取得更大的成就！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。