Regression 回归

李宏毅老师机器学习课程笔记——Regression 回归

一、理论
问题:已知一批宝可梦样本进化前的特征值x_cp, x_s, x_np, x_w, x_n,预测宝可梦升级后的CP值。模型的目标就是找到一个最合适的函数F(X)=Y:
在这里插入图片描述
特征条件X包括{x_cp, x_s, x_np, x_w, x_n}。
首先只考虑一个特征x_cp,寻找宝可梦升级前的CP值与升级后的CP值之间存在的函数关系。
1、step1:model 模型

在这里插入图片描述
2、step2:goodness of function 寻找最优表达式
在这里插入图片描述
上图直线为某个function,要评估这个function的好坏,需要一个评估标准,即损失函数。
-Loss function L:损失函数

放在实例中,假设取了10个宝可梦训练集,损失函数的表达式为:
在这里插入图片描述
y ̂为真实结果集,b+wx_cp函数预测结果集,计算真实结果集与预测结果集的平方差,表示模型的误差,模型目的是使误差尽可能小,找到误差最小的最优function,使得损失函数最小:
在这里插入图片描述
3、step3:gredient descent 梯度下降

求解最小损失函数利用梯度下降法:
η is called 'earning rate' 学习率
-how about two parameters 两个参数求梯度下降
在这里插入图片描述
(1) 随机抽取两个参数值
在这里插入图片描述
(2) 对损失函数分别求w,b的偏导:
在这里插入图片描述
在这里插入图片描述
(3) 继续求w1,b1位置上的偏导:
在这里插入图片描述
在这里插入图片描述
持续求偏导一直到斜率为0,找到全局最优的位置,梯度下降结束,求得最优w,b。
梯度公式可以写为:
在这里插入图片描述
二、计算

利用实际数据,10个宝可梦的样本数据计算:
在这里插入图片描述
求偏导:
在这里插入图片描述
模型除了一元一次函数,还进一步寻找更多模型 selection another model:
在这里插入图片描述
再进一步:
在这里插入图片描述
当模型过于复杂,出现过拟合问题,过拟合指的是模型在训练集上表现优异,但在实际测试集中却表现很差,是因为模型训练过于拟合训练数据,忽略真实分布。

-过拟合的解决方法:Regularization 正则化

首先,多元线性回归表达式:
在这里插入图片描述
在正则化后,表达式为:
在这里插入图片描述
其中,λ的意义就是参数和越小越好,也就能使得函数的曲线更加平滑。
-why smooth functions are preferred 为什么平滑曲线更好?
在这里插入图片描述
当出现噪声时,平滑的曲线函数能够使得噪声更小得影响结果。

三、bias and variance of estimator偏差与方差估计

-Assume the mean of x is μ 平均值
-Assume the variance of x is σ^2 方差

有一组样本{x1,x2,……,x^n},样本的平均值不等于总体的平均值:
在这里插入图片描述
样本的方差不等于总体的方差:
在这里插入图片描述
但是样本平均值m的期望等于总体平均值:
在这里插入图片描述
根据中心极限定理:
在这里插入图片描述
-误差 error:

一组样本函数function的期望就等于E[f^* ]=f ̅,方差表示函数function到期望函数的距离,偏差表示实际函数function到样本期望函数function的距离。

在这里插入图片描述
-方差 variance

简单模型有小方差,复杂模型有大方差。

在这里插入图片描述
-偏差 bias

简单模型有大偏差,复杂模型有小偏差。简单模型的模型范围小,不一定能包含到真实模型;而复杂模型的模型范围大,更有可能包含到真实模型,所以复杂模型的准确率更高。

在这里插入图片描述
-误差是由偏差和方差构成的:

当模型过于简单,偏差大而方差小时,就会出现欠拟合现象,需要增加参数个数继续训练模型;当模型过于复杂,偏差小而方差大时,就会出现过拟合现象,需要减少参数个数,平滑函数曲线,寻找到最优函数。
在这里插入图片描述
-你的模型是bias大还是variance大?
-如果是方差大(复杂模型过拟合),解决方法:
(1)增加样本数据
(2)正则化(平滑曲线)

  • 4
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值