李宏毅机器学习——回归

先给出回归的实际应用例子:
  • 股票预测(stock market forecast)
  • 自动驾驶(self-driving car)
  • 推荐系统(recommendation)

接下来,我们将通过宝可梦进化的例子,来学习认识回归。

1.宝可梦进化的例子
  • step1:选择模型——线性模型
    在这里插入图片描述
    b:表示偏移量
    xi:表示各种特征,如生命值、体重、身高…
    wi:表示各种特征的权重

  • step2:找出最好的function——损失函数

在这里插入图片描述首先,b和w都是未知数,所以在这个函数集合中,包含了成千上万个函数,那么我们怎么知道一个function是好是坏呢?没错,就是损失函数(loss function)
下面这个图是10组training data,this is real data
在这里插入图片描述
xcp:进化前的cp值
y:进化后的cp值
在这里插入图片描述
这就是损失函数的例子,我们可以很容易看出,这是一个最小二乘法的式子。当损失函数越小,说明模型就越好。input:a function,output:how bad it is。

  • step3:gradient descent(梯度下降)
    梯度下降的作用是优化参数w和b。
    当只有一个参数w时:
    在这里插入图片描述
    η:我们可以称为“步长”,或者learning rate。
    由图可知,当w的偏导小于0时,w的值向右移动;当w的偏导大于0时,w的值向左移动,直到不能移动为止,但是好像那不是最小值!还好,在线性模型中我们不会遇到这个问题。
    当有两个的参数的情况:
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    每一条线围成的圈就是等高线,代表损失函数的值,颜色约深的区域代表的损失函数越小
    红色的箭头代表等高线的法线方向
2.进一步优化模型

在这里插入图片描述
当选用一元N次模型时,训练的average error和测试的average error看似都变得更小。但是还要注意一个问题,当我们继续增加幂的次数后,将会出现过拟合问题。如下图
在这里插入图片描述
在这里插入图片描述
当特征量x不再唯一时,如下图
在这里插入图片描述
不同颜色小点,分别表示不同的物种。宝可梦的物种 不同,将对应不同的function。
在这里插入图片描述
在这里插入图片描述
当我们学过信号与系统,将会很容易理解这个式子。假如当输入的xs(表示宝可梦物种)为喷火龙时,那么只有喷火龙的参数有效,其余都为0,这样我们就可以对不同物种进行预测了。
在这里插入图片描述
但是我们的特征参数不止一个,当引入参数过多时我们仍然可能导致结果过拟合。
在这里插入图片描述
在这里插入图片描述

3.正则化(regularization)

在这里插入图片描述
在这里插入图片描述
w 越小,表示function 较平滑的,function输出值与输入值相差不大
在很多应用场景中,并不是 w 越小模型越平滑越好,但是经验值告诉我们 w 越小大部分情况下都是好的。
b的值接近于0 ,对曲线平滑是没有影响

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Maydayz

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值