机器学习——笔记03（error）

最新推荐文章于 2022-12-28 19:51:54 发布

yepoyou

最新推荐文章于 2022-12-28 19:51:54 发布

阅读量241

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36182852/article/details/101373015

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

error=bias+variance

类比射击靶子
bias是一开始就瞄准错了
variance是手抖导致的与瞄准点之间的差距
在这里插入图片描述
模型复杂往往会导致，数据多散布开。

bias大是指大家都偏离靶心很大；小bias是指数据的均值距离靶心很近，但这并不代表数据都距离靶心近，很可能是比较分散的。

蓝色线条为平均，黑色为靶心。
模型简单，比较集中但是平均起来并不怎么贴合靶心；模型复杂，比较分散但平均起来比较贴合靶心。
model越复杂，space越大。target在其中的可能性就越大。

bias VS variance

在这里插入图片描述
瞄的越来越准（红色），越来越贴近靶心；散布的越来越大（绿色）；综合考虑两方面因素（蓝色），3附近较好。最右边，overfitting，最左边underfitting；即error来自variance较多则过拟合，来自bias较多，则欠拟合。

overfitting VS underfitting

模型不适合训练集，bias大，欠拟合
训练集效果好，测试集有很大误差，variance大，过拟合

在这里插入图片描述
对策：bias造成的误差，重新设计更复杂的模型，考虑更多的特征进来。

对策：variance造成的误差

更多的数据。
正则化，更平滑的函数。正则化简单理解为增加条件限定缩小范围，让样本更加集中来减少variance。缺点是该条件原本是不存在的，很可能与目标偏差更远。

model selection

真正的测试集（橙色）和验证集（绿色）是有区别的。在这里插入图片描述
解决方法

交叉检验
N叠交叉检验

这时候public上的才能够真正反映private上的err

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——笔记03（error）

error=bias+variance类比射击靶子bias是一开始就瞄准错了variance是手抖导致的与瞄准点之间的差距模型复杂往往会导致，数据多散布开。bias大是指大家都偏离靶心很大；小bias是指数据的均值距离靶心很近，但这并不代表数据都距离靶心近，很可能是比较分散的。蓝色线条为平均，黑色为靶心。模型简单，比较集中但是平均起来并不怎么贴合靶心；模型复杂，比较分散但平均起...
复制链接

扫一扫

专栏目录

yepoyou CSDN认证博客专家 CSDN认证企业博客

码龄8年

84: 原创

31万+: 周排名

154万+: 总排名

10万+: 访问

: 等级

1270: 积分

29: 粉丝

86: 获赞

14: 评论

500: 收藏

私信

关注

热门文章

分类专栏

注意力 3篇
多标签识别 7篇
语言 12篇
Python 26篇
Java 1篇
Linux 7篇
微服务 1篇
编译器 2篇
爬虫 12篇
机器学习 6篇
图像处理 2篇
神经网络 13篇
pytorch
深度学习 13篇
Java web 14篇
Spring 3篇

最新评论

【Linux】PKG_CONFIG_PATH
biomooc: 显然是 LD_LIBRARY_PATH
【论文阅读】[ML-GCN] Multi-Label Image Recognition with Graph Convolutional Networks
2301_80844976: 出现这个错误是为什么啊？ FileNotFoundError: [Errno 2] No such file or directory: '/data/coco/coco\\data/annotations\\instances_train2014.json'
【论文阅读】[ML-GCN] Multi-Label Image Recognition with Graph Convolutional Networks
快乐学习呢: 文章提炼总结得很好
【数据分析】统计json文件中类别信息并可视化
z*xy: 您好，我最近正在学习文本解析这方面的知识，可以发一份您的数据集给我吗，谢谢。邮箱3072683664@qq.com
【Linux】PKG_CONFIG_PATH
老梁子wes: “在GTK+及其依赖库的安装过程中对于库的搜索路径的设置将采用第一种方式进行”，这个“第一种方式”，是设置LD_LIBRARY_PATH，还是“为了使库的设置变得简单一些，可以把下面的这两句设置保存到一个文件中”避免新旧版本冲突的方法

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。