李宏毅机器学习笔记--Regression

最新推荐文章于 2024-03-19 15:43:55 发布

苍雪Blog

最新推荐文章于 2024-03-19 15:43:55 发布

阅读量251

点赞数

分类专栏：笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42026596/article/details/107515970

版权

笔记专栏收录该内容

5 篇文章 0 订阅

订阅专栏

Regression

可以做什么？

Stock Market Forecast
Self-driving Car （输出方向盘角度）
Recommendation （购买商品的可能性，根据可能性的大小决定是否给用户推荐
。。。

步骤

Step1 : Model
- 就是建立一个函数： y = b + W * X (W and b are prameters which can be any
  value)
- like a Linear model : $\sum W_{i}*X_{i}$
  (Xi : an attribute if input X feature Wi : weight b: bias )
Step2 : Goodness of Function
- training data (有输入，有输出）
- Loss function L => 一个函数用于评价 b 和 w 的好坏。
- input : a function, ouput : how bad it is
- L(f) = L(w,b) = $\sum (\widehat{y}^{n} - (b + w * x_{n}^{cp}))^{2}$ （真实值 - 预测值)^2的求和
Step 3 ： Best Function

Gradient Descent

**Gradient Descent** 就是用来解决这个问题的，用来找出一个最小的Function 只要这个函数是可微的，那么就可以使用Gradient Descent来求解。

Consider loss function L（W） with one parameter w ：
- ~~最简单的方法就是枚举所有w,来找出使得 Loss 最小的 parameter，但是这样是没有效率的~~
- (Randomly) Pick an initial value $w^0$
- Compute $\frac{dL}{dw} |_{w=w^0}$
  - 倒数值代表的是 $W^0$ 点出切线的斜率
  - 如果该值是负的则增加W
  - 如果该值是正的则减少W
  - $W_{new} = W_{old} - \eta * \frac{dL}{dw} |_{w=w^0}$ ( $\eta$ 叫做 Learning rate）
- 重复计算 $\frac{dL}{dw} |_{w=w^1}$ **
- 如果是多个参数则分别计算各个参数的偏导数

结果

结果最重要的是 Generalization
我们真正关心的是这个Function在新数据上到错误率（测试集）
结果不好的话，可以重新选择一个model安照上面的方法进行训练

Overfitting

model越复杂，在训练集上得到的结果越来越好，但是在测试集上结果确越来越差
增加正则化项Regularization

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。