李宏毅机器学习笔记第3周_案例讲解回归问题


一、Regression

Regression可以应用在很多方面,例如Stock Market Forecast(股市预测)、Self-driving Car(自动驾驶汽车)和Recommendation(推荐)。这里主要是通过讲解案例预测pekemons(宝可梦)进化后的战斗力,在这里我们要寻找的一个函数,input为宝可梦,outputt为宝可梦进化后的cp值。

二、Step1 Model

1) 我们需要建立一个Model,例如y=b+wx。
2) w和b可以是很多参数,例如:
f1:y=10.0+9.0
x;
f2:y=9.8+9.2x;
f3:y=-0.8-1.2
x;
3) 在这么多function中不是所有都是正确的,因此我们需要找到符合要求的function。
4) 这些model都是Linear model:y=b+Σwi*xi,其中xi是输入一组x的feature,wi为weight,b为bias。

三、Step2 Goodness of Function

1) 我们收集10只宝可梦,得到他们的进化后的情况。
在这里插入图片描述
2) 通过上图所示,我们需要定义一个另外的function,来衡量一个参数(w,b)的好坏,它叫做Loss function,也就是函数的函数。
Input:a function,output:how bad it is。
3) 我们拥有了Loss function以后,我们可以对参数w,b作图。图上的每一个点就是代表一组w和b,点越偏向于红色,function越不好,而越偏向于蓝色,function越好。最好的function落在smallest上,它是可以让Loss最低的function。
在这里插入图片描述

四、Step3 Best Function

1) 我们现在需要在function中寻找到最好的function,也就是寻找Loss值最小,因此我们需要穷举所有的w和b来寻找。
在这里插入图片描述
2) 我们可以使用Gradient Descent(梯度下降)来进行计算。首先随机选取初始点w0,计算在w0这个位置Loss的微分,也即是斜率。当斜率为正时,则需要减小w,当斜率为负时,则需要增加w。
3) 每一次向右移动多少的w,主要取决于两个因素。第一个是当前点的微分值, 如果微分值越大,曲线就越陡峭,那么移动的距离就越大,反之就越小。另一个是取决于常数项η,我们把它叫做“learning rate”,它是事先就定好的数值。
4) 我们把w0更新为w1,我重复这个过程,经过反复的更新我们就会得到一个最低点,也就是Local optimal,但它不是最佳解。
在这里插入图片描述
5) 当我们讨论两个参数时,也即是w和b。首先选取初始值w0和b0,跟上述方式一样反复更新w和b,最后就会找到Loss比较小的w和b。
在这里插入图片描述
6) Gradient Descent有一个让人担心的地方,因为得到时是随机的。但是在linear regression中,Loss function是convex,convex的意思是没有Local optimal的位置,所以Gradient Descent找出来的最佳参数和找出来的参数是一致的。
在这里插入图片描述
7) 计算L对w的偏导数和L对b的偏导数。
在这里插入图片描述

五、How’s the result?

1)通过上述过程,我们可以得到最好的w和b。但是我们通过下面的图像可以发现不是所有的点都是符合函数的,存在误差的情况,会造成预测不准的情况。因此我们可以考虑找到更复杂的Model,进一步优化结果。
在这里插入图片描述
2)我们考虑选择二次方程、三次方程、四次方程,甚至是多次方程。结果显示通过增加函数的次数,Training data越来越小,但是Testing data先是减小,然后增大,在五次方程中,Testing data增长的异常的大,这种现象称为Overfitting。因此得出结论,function不是次数越多越好,越复杂越好,而是要选择合适的model。
在这里插入图片描述
3)收集更多的数据,我们会发现存在隐藏的因素(宝可梦的物种)影响结果。因此我们第一步需要重新去设计model,第二步需要regularization。最后的结论是宝可梦进化前的cp值、进化后的cp值和它的物种是有着重要关系的,可能也有其它的因素存在着影响。


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值