统计机器学习笔记2——评价模型精度

最新推荐文章于 2023-10-08 17:32:28 发布

糖醋代码文

最新推荐文章于 2023-10-08 17:32:28 发布

阅读量1.1k

点赞数 1

分类专栏：统计机器学习笔记文章标签：机器学习人工智能大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Yeeyi_max/article/details/124975007

版权

本文介绍了统计机器学习中模型精度的评价方法，包括拟合效果检测、偏差-方差权衡以及分类模型的精度讨论。通过分析训练和测试均方误差，探讨了过拟合现象，以及如何平衡模型的偏差和方差。同时，文章提到了贝叶斯分类器和KNN分类器，并讨论了K值选择对KNN的影响。

摘要由CSDN通过智能技术生成

摘要

统计机器学习甚至是以前的课程中，会学习很多统计学习方法。不同的统计方法在不同的数据集上表现并不一样，老师强调说“在统计学中没有免费的午餐”，也就是说，没有任何一种方法在任何一个数据集中都比其它的方法好。在实践中，针对每一个数据集选择最好的方法非常重要。

评价模型精度

拟合效果检测

MSE(Mean Squared Error 残差均方误)
回归问题中， $MSE=\frac{1}{N}\sum_{i=1}^{N}(y_i-\hat y_i)^2$
测试、训练集
训练数据就是用来拟合模型的。某些情况下，我们还能得到一组合适的测试数据，将由训练数据估计出的模型，来预测测试数据上的 $X$ 对应的 $\hat Y$ ，将其与测试数据上的真实 $Y$ 比较。计算得出测试均方误差。我们选择的模型应该要使测试均方误差尽可能小，这种方法大大避免了模型过拟合的现象。

一般情况下，测试数据不一定容易获取。我们将所有的观测值样本划分为训练集和测试集（打比方，就是我只用80%的数据当训练集，剩下的当测试集。当然划分方法有很多，后面会详细介绍），通过训练集来估计模型参数。一个模型的训练均方误最小时，不能保证模型的测试均方误最小。

过拟合（Overfitting）
当所建的模型产生一个较小的训练均方误差，但却有一个较大的测试均方误，就成该数据被过拟合。过拟合现象的存在意义是说明需要降低模型的光滑度，也就是复杂度（自由度）。

偏差-方差权衡（The Bias-Variance Trade-off）

除了MSE之外，还有两个指标影响我们对统计学习模型的选择：偏差和方差。
$Ave_{(x_i,y_i)\in test}(y_i-\hat f(x_i))^2$

最低0.47元/天解锁文章

糖醋代码文

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
统计机器学习笔记2——评价模型精度

“在统计学中没有免费的午餐”，也就是说，没有任何一种方法在任何一个数据集中都比其它的方法好。在实践中，针对每一个数据集选择最好的方法非常重要。
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。