李宏毅《机器学习》笔记-2.Regression

本文介绍了机器学习中的线性回归,通过宝可梦cp值预测案例详细阐述模型设计、评估与优化。讨论了如何通过梯度下降找到最佳函数,并解释了过拟合现象和解决方案,包括收集更多数据和正则化。
摘要由CSDN通过智能技术生成

1. 什么是Regression(回归)

如果一个任务的输出(output)是一个数值(scalar),那么这种任务就是Regression(回归)。
例如:股票指数预测;无人驾驶中输出方向盘角度;商品推荐中使用者购买商品的可能性等
在这里插入图片描述

2. 线性回归案例:宝可梦cp值

根据宝可梦当前cp值以及一些其他指标,预测进化后的cp值
在这里插入图片描述

使用机器学习三板斧

Step1. 设计模型(Model)

假设进化后的cp值为y,y与进化前的cp值 x c p x_{c p} xcp 成线性关系,则我们可以设计如下线性模型: y = b + w ⋅ x c p y=b+w \cdot x_{c p} y=b+wxcp,其中w是权重,b是偏差。若给出不同的权重和偏差,就可以得出一堆函数 f 1 , f 2 ⋯ f_{1}, f_{2} \cdots f1,f2
若考虑多个特征(feature),则可以构建一个相对复杂的线性模型: y = b + ∑ w i x i y=b+\sum w_{i} x_{i} y=b+wixi,这里的 w i w_{i} wi 分别是每个 x i x_{i} xi 对应的权重。

Step2. 判断模型好坏(Goodness of Function)

取10只宝可梦,假设真实值是 y ^ 1 ⋯ y ^ 10 \hat{y}^{1} \cdots \hat{y}^{10} y^1y^10。我们需要一个额外的函数去评价真实值和预测值的好坏,这个函数成为 损失函数(Loss function)
在线性模型中,我们使用平方误差函数,即:
L ( f ) = ∑ n = 1 10 ( y ^ n − f ( x c p n ) ) 2 \mathrm{L}(f)=\sum_{n=1}^{10}\left(\hat{y}^{n}-f\left(x_{c p}^{n}\right)\right)^{2} L(f)=n=110(y^n

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值