LHY机器学习笔记-2

最新推荐文章于 2024-11-10 23:24:28 发布

黎明沐白

最新推荐文章于 2024-11-10 23:24:28 发布

阅读量262

点赞数

分类专栏： LHY机器学习文章标签：机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42047140/article/details/120305263

版权

LHY机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文章目录

Regression 回归
- 模型步骤

Regression 回归

模型步骤

step1：模型假设，选择模型框架（线性模型）
step2：模型评估，如何判断众多模型的好坏（损失函数）
step3：模型优化，如何筛选最优的模型（梯度下降）

选择模型

线性模型： $\sum w_ix_i$ 形如

其中， x_i 为特征，w_i 是各个特征权重， b 是偏置项

模型评估

引入损失函数通过量化进化后的CP值（实际值）与模型预测的CP值的差，来评估模型

$\sum_{n=1}^{10}( \hat y^n - f(x^n_{cp}) )^2$

$\sum_{n=1}^{10}(\hat y^n - (b + w·x^n_{cp}))^2$

规定损失函数的值越小，模型效果越好

筛选最佳模型——梯度下降

目标：找到合适的参数 $ w, b $ 使得损失函数 $ f $ 的值最小
$f^* = arg \min\limits_{f}L(f)$

$w^*, b^* = arg \min\limits_{w,b}L(w, b) = arg \min\limits_{w,b}\sum_{n=1}^{10}(\hat y^n - (b + w·x_{cp}^n))^2$

方法：梯度下降算法

步骤1：随机选取一个 $w^0$
步骤2：计算微分，也就是当前的斜率，根据斜率来判定移动的方向
- 大于0向右移动（增加w）
- 小于0向左移动（减少w）
步骤3：根据学习率移动
$w^1 \leftarrow w^0 - \eta \frac{dL}{dW} |_{w=w^0}$
重复步骤2和步骤3，直到找到最低点

对于线性模型其损失函数是凸函数，因此可以通过梯度下降方法找到其最低点

验证模型好坏

选取测试集，将训练好的模型应用到测试集数据上，计算其损失函数的值

过拟合问题

一次模型不好，选取一元多次模型对数据进行拟合，可能会出现过拟合现象

课程案例中三次以上的模型即会出现过拟合现象（在测试集上损失函数的值过大）

出现过拟合的原因：

每一个模型结果都是一个集合，5次模型包 $\supseteq$ 4次模型 $\supseteq$ 3次模型，所以在4次模型里面找到的最佳模型，肯定不会比5次模型里面找到更差

模型优化

考虑更多参数、更多输入数据
正则化方法
$\sum w_i b_i$

$\sum_n(\hat y^n - (b + \sum w_i x_i))^2 + \lambda\sum(w_i)^2$

引入正则化，目的是使得拟合曲面变得平滑

w 越小，表示 function 较平滑的， function输出值与输入值相差不大
在很多应用场景中，并不是 w 越小模型越平滑越好，但是经验值告诉我们 w 越小大部分情况下都是好的
b 的值接近于0 ，对曲线平滑是没有影响

P.S. 本次笔记练习了如何使用LaTeX去打公式，hhh

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。