机器学习笔记_李宏毅_P3-Regression-case study


课程视频

例子

用Regression预测宝可梦进化后的CP值
在这里插入图片描述

步骤

第一步:模型function sets

在这里插入图片描述
寻找最合适的函数f,也就是寻找最合适的参数w,b

第二步:寻找最好的函数

训练数据: 10只宝可梦
在这里插入图片描述
最好的函数为:损失函数最小

在这里插入图片描述
如何使得损失函数最小?:随机梯度下降法
在这里插入图片描述
举例子说明什么是随机梯度下降法?如何计算?
假设只有一个参数w
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
假设只有两个参数w,b
在这里插入图片描述
考虑到一个问题:在linear model中,没有局部最优,所以可以放心的随机选取初始值w,b
在这里插入图片描述

第三步:算法

在这里插入图片描述

结果

训练误差
在这里插入图片描述

测试误差
在这里插入图片描述
看上图可能会觉得拟合不是很好,会想到增加项来使得拟合更好?
在这里插入图片描述
在这里插入图片描述
可以看到随着增加项,训练误差和测试误差都在递减,那么继续增加
在这里插入图片描述
在这里插入图片描述
可以看到继续增加项,模型越来越复杂,训练误差在递减,但是测试误差反而增大了,也就是过拟合
在这里插入图片描述


上述例子中输入只有宝可梦的原始CP值,假设输入涉及更多的属性呢?

在这里插入图片描述
那么又要返回第一步重新设计模型,但模型太复杂,会产生过拟合
在这里插入图片描述
如何解决过拟合的问题呢?引入正则化
在这里插入图片描述
最后的结果如图,我们可以选择 𝜆 = 100
在这里插入图片描述

总结

  • 构造模型

  • 利用损失函数去判断模型的好坏

  • 用梯度下降法去获得使函数最好的参数

  • 模型越复杂,训练误差越小,但是会导致过拟合

  • 考虑其他特征因素,重新构造模型,容易产生过拟合

  • 使用正则化来解决过拟合:弱化权重系数,使得函数更加平滑

宝可梦数据

作业地址

Kaggle比赛地址

机器学习笔记_李宏毅_P4-Basic Concept_error的来源
作业范例

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值