【机器学习 笔记1】Error Space

课程链接

李宏毅2020机器学习深度学习(完整版)国语-basic concept
课程学习网站 链接

1.Bias and Variance of Estimator

实际真实函数f^
训练拟合函数f*
多次实验得到的多个拟合函数的期望f-
f*和f^的误差error,可以分解为error due to “bias” 和error due to “variance”
在这里插入图片描述在这里插入图片描述

2. Model Diagnosis

模型诊断是优化模型的关键。

【模型复杂度与error的关系】
随着模型的复杂度增加,error情况变化如👇
在这里插入图片描述
在error from bias和error from variance取折中,以期待得到最小的total error。

【模型诊断和优化方向】
模型无法拟合训练数据,多半是large bias
可以考虑提高模型复杂度,如:增加feature数量,选择更加复杂的函数
模型可以拟合训练数据,无法拟合测试数据,多半是large variance
可以考虑:扩充数据集,归一化(平滑模型)
在这里插入图片描述在这里插入图片描述

3. Model selection

模型选择的标准:最小的total error。
模型选择的方法:交叉验证法、N折交叉验证法

交叉验证:将训练数据按一定比例分成训练集和验证集,以验证精度作为选择标准。

在这里插入图片描述
N折交叉验证:
1.将训练数据均分N份
2.一份最为验证集,余下用于训练集
3.平均验证精度作为选择标准,模型择优
4.用全部训练集对最优模型进行训练,得到最终模型
在这里插入图片描述

1的补充,举例说明

一变量x,假设其均值为μ,方差为σ2

1.1均值估计器

取样方式:N个x
估计模型:求和取均
在这里插入图片描述
一次取样,一次估计的【均值估计值m】,与【均值真值μ】有【误差error】
但多次(无限次)取样,多次估计的【均值估计值m】的【期望E(m)】,与【均值真值μ】无【偏差bias】
所以均值估计器,没有 【error due to “bias”】,是无偏估计
在这里插入图片描述 在这里插入图片描述
多次(无限次)取样,多次估计的【均值估计值m】的【方差Var(m)】,与【均值真值μ】的【方差σ2】呈线性关系。
单次取样数N越大,其方差越接近,但不会相等,存在【error due to “variance”】
【注】此处Smaller N和Larger N 写反了👇。
在这里插入图片描述在这里插入图片描述

1.2方差估计器

取样方式:N个x
估计模型:求和取均,再求方差

多次(无限次)取样,多次估计的【方差估计值s2】的【期望E(s2)】,与【方差真值σ2】有【偏差bias】
所以均值估计器,存在 【error due to “bias”】,是有偏估计
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值