task_3

最新推荐文章于 2022-11-03 10:47:16 发布

无价攻城狮

最新推荐文章于 2022-11-03 10:47:16 发布

阅读量172

点赞数

分类专栏：笔记文章标签：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45722145/article/details/115104505

版权

本文探讨了机器学习中优化模型和评估指标的重要性，重点关注方差-偏差的权衡。介绍了训练和测试均方误差，解释了模型的方差和偏差的概念。通过K折交叉验证来提高模型的泛化能力，并讨论了正则化算法如L1和L2范数在降低模型复杂度中的作用。此外，还提到了降维技术，如主成分分析（PCA）及其核方法，以及为何在统计学中需要理解和应用协方差矩阵。

摘要由CSDN通过智能技术生成

优化模型、评估模型指标

训练均方误差：训练集上的数据，那么这个误差为训练均方误差

测试均方误差：测试集的数据计算的均方误差，我们称为测试均方误差

目标：我们并不关心模型在训练集上的训练均方误差，我们关心的是模型面对未知的样本集，即测试集上的测试误差，我们的目标是使得我们建立的模型在测试集上的测试误差最小。

训练误差达到最小时，测试均方误差一般很大

在这里插入图片描述

模型的方差：用不同的数据集去估计ff时，估计函数的改变量，例如：100个1000人的样本集。我们使用线性回归模型估计参数就能得到100个线性回归模型。由于样本抽取具有随机性，我们得到的100个模型不可能参数完全一样，那么这100个模型之间的差异就叫做方差。一个稳定的模型，也就是在不同的样本集估计的模型都不会相差太大，即要求f的方差越小越好。一般来说，模型的复杂度越高，f的方差就会越大。方差度量的是同一个模型在不同数据集上的稳定性

模型的偏差：以一个的模型去估计真实函数时存在的误差，偏差度量了某个学习算法的期望预测与真实结果的偏离程度，即刻画了某个学习算法本身的拟合能力。偏差度量的是某个模型的学习能力。

方差–偏差的权衡

一般而言，增加模型的复杂度，会增加模型的方差，但是会减少模型的偏差，我们要找到一个方差–偏差的权衡，使得测试均方误差最。

最低0.47元/天解锁文章

无价攻城狮

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

无价攻城狮 CSDN认证博客专家 CSDN认证企业博客

码龄5年

34: 原创

54万+: 周排名

181万+: 总排名

1万+: 访问

: 等级

388: 积分

13: 粉丝

3: 获赞

2: 评论

3: 收藏

私信

关注

热门文章

分类专栏

NLP 1篇
笔记 26篇
XGB、LBG、GBDT 2篇
GBDT分类与回归 1篇
异常检测 6篇
SQL 1篇

最新评论

task02
普通网友: 博主的技术面很广哦，而且都是干货文章，小菜鸟求带，可以加你微信随时和您交流吗，感谢
task_1
Rex~: 不错本来准备自己总结一下，比我的全面。
successfulHomework_1
不正经的kimol君: 忍不住就是一个赞，写得很棒，欢迎回赞哦~

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。