李宏毅《机器学习》任务二

本文介绍了回归模型的基本概念,包括一元和多元线性模型的应用,如股票市场预测、自动驾驶等。重点讲解了模型假设(线性模型)、模型评估(损失函数)以及优化过程(梯度下降)。通过实例演示了如何通过训练和测试来选择最佳模型,并探讨了过拟合问题和正则化的解决方案。
摘要由CSDN通过智能技术生成

Task02开始啦:
参照开源文档,观看视频 P3-4:回归(2天)
开源文档:https://datawhalechina.github.io/leeml-notes
P3视频:https://www.bilibili.com/video/BV1Ht411g7Ef?p=3
P4视频:https://www.bilibili.com/video/BV1Ht411g7Ef?p=4

回归

1 定义

Regression 就是找到一个函数 functionfunction ,通过输入特征 xx,输出一个数值 ScalarScalar。

2 应用

股市预测(Stock market forecast)
自动驾驶(Self-driving Car)
商品推荐(Recommendation)
Pokemon精灵攻击力预测(Combat Power of a pokemon)

3. 模型步骤

  • step1:模型假设,选择模型框架(线性模型)
  • step2:模型评估,如何判断众多模型的好坏(损失函数)
  • step3:模型优化,如何筛选最优的模型(梯度下降)

step1:模型假设 - 线性模型

(1)一元线性模型(单个特征)
假设以Pokemon精灵过去的攻击值 x c p x_{cp} xcp为例,线性模型架设为 y = b + w ⋅ x c p y=b+w \cdot x_{cp} y=b+wxcp w w w b b b可以猜测多个不同的值,得到很多个不同的假设模型。
(2)多元线性模型(多个特征)
实际应用中,输入特征会有许多个,因此可以假设线性模型为:
y = b + ∑ w i ⋅ x i y=b+ \sum w_{i} \cdot x_{i} y=b+wixi

- x i x_{i} xi:各种特征(feature)
- w i w_{i} wi:各种特征的权重(weight)
- b b b:偏移量
在这里插入图片描述

step2:模型评估 - 损失函数

收集和查看训练数据
判断众多模型的好坏
在这里插入图片描述
在这里插入图片描述

step3:最佳模型 - 梯度下降

  • 筛选最优模型(参数 w , b w,b w,b
  • 在这里插入图片描述
  • 在这里插入图片描述

在这里插入图片描述

  • 梯度下降推演最优模型的过程
  • 在这里插入图片描述

验证训练好的模型的好坏

(1)首先用10组数据训练,然后再使用10组数据测试模型,求得平均误差值。
(2)在上一步的模型中加入2次项,3次项,4次项,5次项,分别计算训练集的平均误差和测试集的平均误差。可以观察到在训练集上表现更为优秀的模型,在测试集上效果反而变差。这就是模型在训练集上过拟合的问题。
将错误率结果图形化展示,发现3次方以上的模型,已经出现了过拟合的现象。

步骤优化

Step1优化:2个input的四个线性模型是合并到一个线性模型中

Step2优化:如果希望模型更强大表现更好(更多参数,更多input)

Step3优化:加入正则化

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值