Machine Learning Regression-Case Study

回归可以做什么?

pm2.5的预测案例;
股票的预测:找一个函数 input可能是过去的股票资料 output是明天的点数;
无人车:input是information output是方向盘等;
推荐系统。

应用案例:

预测宝可梦的CP值

我们要做的是:找一个函数,输入是一只宝可梦,输出是进化后的CP值在这里插入图片描述
Xcp是进化前的CP值,Xs是所属物种,Xhp是生命值,Xw是重量,Xh是高度。

Step1 :Model

在这里插入图片描述w、b是参数

Step 2:评估函数的好坏

在这里插入图片描述
函数的输入:用上标表示一个完整的object (个体)的编号,用下标表示component
在这里插入图片描述
收集了十只神奇宝贝的数据;
蓝色点代表一只宝可梦。
在这里插入图片描述

定义一个Loss Function,输入是一个函数,衡量参数的好坏。估测的误差越大,选择的函数越差。
在这里插入图片描述
图中的一个点代表一个function 颜色代表Loss函数的值,越偏红色,定义的函数越糟糕,越偏蓝色误差越小。

Step3:选择Best Function

上述操作衡量了函数的好坏,然后需要挑选一个最好的function。
在这里插入图片描述
只要L(f)是可微分的 梯度下降法都可以用来求较好的参数。L(f)即是Loss函数。
在这里插入图片描述

L(w)可能是可微分的任意的函数。
穷举所有w的可能值,看哪一个w的值最小。此做法效率很低。
所以,随机选取一个初始的点W0,在该点处计算微分(切线的斜率),斜率是负的,Loss值左高右低,所以想减小Loss值,需要增加w的值。
在这里插入图片描述
在该例中,w会增加,增加量如何?
增加量取决于,1.现在的微分值 2.学习率(常数)
依据在这里插入图片描述
来更新w的值
在这里插入图片描述
然后再重复上述的步骤。
在这里插入图片描述
经过多次的更新,会找到一个l局部最小值,此时的微分为0.
在这里插入图片描述
有两个参数的情况。

在这里插入图片描述
颜色代表Loss的数值;选择红色的点计算偏微分,更新参数,其实红色箭头所指的方向就是等高线的法线的方向。

在这里插入图片描述

Gradient Decent有一个让人担心的地方:如果Loss如上图所示,取点的不同会导致不同的最小值。但是在线性回归中,Loss函数都是凸函数,没有局部最优点。

计算偏微分的公式
在这里插入图片描述
在这里插入图片描述

以上是求的对新数据的误差,比training data上的误差值大一些。
可以做的更好吗?重新选择Model。
可能要引入二次式。
在这里插入图片描述
引入三次方。
在这里插入图片描述
可能Model更复杂。
在这里插入图片描述
在这里插入图片描述
Model更复杂,Testing Data上的误差反而更大了。
在这里插入图片描述
在这里插入图片描述
在测试集上的误差随着Model变的复杂而变大,此时发生了过拟合。
在这里插入图片描述
选三次式作为结果。
在这里插入图片描述

搜集更多的宝可梦。
在这里插入图片描述
考虑宝可梦的物种的影响。
所以重新设计Model。
在这里插入图片描述
将上述的式子改写成线性的。
在这里插入图片描述
在这里插入图片描述
输入的是Pidgey。

在这里插入图片描述

不同种类的宝可梦,他们的Model就会不一样。
在这里插入图片描述

其他可能会影响CP值的因素。
在这里插入图片描述

将所想到因素全都加入模型。出现了过拟合现象,使用正则化来解决。
在这里插入图片描述
在Loss中加入而外的项。当 wi 接近0时,曲线是比较平滑的,即当输入有变化时,输出对输入的变化不敏感。
为何喜欢更加平滑的函数?如果有一个被杂讯干扰的输入,平滑的函数会受到比较小的影响。

在这里插入图片描述

λ值越大,曲线越平滑。Training data上的误差越大。因为当λ越大,越倾向于考虑w本来的值,考虑error就越小。当function太平滑,在Testing Data 上的误差反而会增大。

在这里插入图片描述
最后的选择。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值