机器学习笔记——误差哪来的？

最新推荐文章于 2022-03-12 22:54:04 发布

AgentSmart

最新推荐文章于 2022-03-12 22:54:04 发布

阅读量377

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dzc_go/article/details/108707376

版权

机器学习笔记——误差哪来的？

一、回顾案例
二、误差所在
三、解决方法
四、我的疑问

一、回顾案例

上一篇博文中我们通过宝可梦进化的案例初步了解了回归分析的过程。
从模型选择->损失函数构建->梯度下降得到最优参数->模型变量高次化复杂模型->多输入变量复杂模型。
无论是通过高次化变量还是增加考虑因素，复杂化后的模型确实在训练数据集中表现更加优异，但规律并不同等适合于测试数据集。我们也因此发现了过拟合(Overfitting)的现象。
那我们就像要知道误差到底来源于哪里？只有我们知道了误差来源才能够对症下药，解决模型选择与参数最优化的相关难题。

二、误差所在

1.误差来源

先给出结论，在该案例中误差来源于bias(偏差)与variance(方差)。
设 $\hat{f}$ 为y与x之间的真实函数关系， $f^*$ 是我们选定模型经过梯度下降得到的函数关系，而 $\bar{f}$ 表示相同模型不同训练集求出的函数关系的期望值。
一个固定的模型不同训练集可能会产生多个 $f^*$ ，但一定对应一个固定的 $\bar{f}$ 。我们可以把 $\bar{f}$

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习笔记——误差哪来的？

机器学习笔记——误差哪来的？一、回顾案例二、误差所在1.误差来源2.bias 与 variance四种组合三、解决方法一、回顾案例上一篇博文中我们通过宝可梦进化的案例初步了解了回归分析的过程。从模型选择->损失函数构建->梯度下降得到最优参数->模型变量高次化复杂模型->多输入变量复杂模型。无论是通过高次化变量还是增加考虑因素，复杂化后的模型确实在训练数据集中表现更加优异，但规律并不同等适合于测试数据集。我们也因此发现了过拟合(Overfitting)的现象。那我们就像要
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。