task_3

本文探讨了机器学习中优化模型和评估指标的重要性,重点关注方差-偏差的权衡。介绍了训练和测试均方误差,解释了模型的方差和偏差的概念。通过K折交叉验证来提高模型的泛化能力,并讨论了正则化算法如L1和L2范数在降低模型复杂度中的作用。此外,还提到了降维技术,如主成分分析(PCA)及其核方法,以及为何在统计学中需要理解和应用协方差矩阵。
摘要由CSDN通过智能技术生成

优化模型、评估模型指标

训练均方误差:训练集上的数据,那么这个误差为训练均方误差

测试均方误差:测试集的数据计算的均方误差,我们称为测试均方误差

目标:我们并不关心模型在训练集上的训练均方误差,我们关心的是模型面对未知的样本集,即测试集上的测试误差,我们的目标是使得我们建立的模型在测试集上的测试误差最小。

训练误差达到最小时,测试均方误差一般很大

在这里插入图片描述

模型的方差:用不同的数据集去估计ff时,估计函数的改变量,例如:100个1000人的样本集。我们使用线性回归模型估计参数就能得到100个线性回归模型。由于样本抽取具有随机性,我们得到的100个模型不可能参数完全一样,那么这100个模型之间的差异就叫做方差。一个稳定的模型,也就是在不同的样本集估计的模型都不会相差太大,即要求f的方差越小越好。一般来说,模型的复杂度越高,f的方差就会越大。方差度量的是同一个模型在不同数据集上的稳定性

模型的偏差:以一个的模型去估计真实函数时存在的误差,偏差度量了某个学习算法的期望预测与真实结果的偏离程度,即刻画了某个学习算法本身的拟合能力。偏差度量的是某个模型的学习能力。

方差–偏差的权衡

一般而言,增加模型的复杂度,会增加模型的方差,但是会减少模型的偏差,我们要找到一个方差–偏差的权衡,使得测试均方误差最。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值