模型训练的bias，variance，validation的简介

最新推荐文章于 2024-01-15 20:23:10 发布

NP_hard

最新推荐文章于 2024-01-15 20:23:10 发布

阅读量494

点赞数 1

分类专栏： Machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/NP_hard/article/details/118518854

版权

本文以宝可梦升级为例，解释机器学习中的Bias和Variance概念，展示了模型复杂度如何影响Bias和Variance，并讨论了模型选择中的验证策略，如Cross Validation和N-fold Cross Validation的重要性。

摘要由CSDN通过智能技术生成

文章目录

本次文章的内容是参考的李宏毅老师的机器学习课件，我认为课件中关于bias，variance，validation的部分讲的很好，很生动，于是想写一篇简单的blog来记录。

Bias and Variance

为了生动的说明什么是Bias，什么是Variance，我会举一个抓宝可梦的regression的例子。

假设你是一个宝可梦训练家，你需要使用糖果去升级你的宝可梦去打道馆，这个游戏里的程序员设置了一个升级函数 $\hat{f}$ ，输入你的宝可梦的特征（名字，HP，体重，身高，…）来输出升级后你的宝可梦的能力值CP
在这里插入图片描述
然后我们现在是宝可梦研究员，我们想通过抽取样本（抓宝可梦）来训练regression模型 $f^*$ 来预测宝可梦的CP成长曲线

在这里插入图片描述
由于抽取的样本太少，我们的regression模型 $f^*$ 肯定与真实的函数 $\hat{f}$ 存在误差，这里就引出来了Bias和Varience的问题。

假设我们一开始使用的是简单的线性模型
$y=b+w*x_{cp}$
假设我们每次抓N只宝可梦 ${x^1,x^2,...,x^N\}$

这个世界是存在平行宇宙的，假设每个平行宇宙都在抓宝可梦
在这里插入图片描述
由于每个平行宇宙抓的宝可梦数值不同，所以每个平行宇宙的宝可梦研究院训练出的模型也不一样

于是我们就得到了很多个由不同样本训练出来的模型 $f^*$

如下图所示，红色的靶心就是 $\hat{f}$ ，一坨蓝点就是各个 $f^*$ ，它们的代表，也就是它们的期望为 $\bar{f}$ ，Bias和Variance的定义就如下图所示
在这里插入图片描述

我们可以把这些蓝点，也就是 $f^*$

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。