模型评估与选择

xiaogao2017

于 2018-07-18 18:08:57 发布

阅读量675

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaogao2017/article/details/81102858

版权

本文深入探讨模型评估与选择的过程。介绍了测试数据的使用，如测试集、校验集和k折交叉验证，强调了sklearn中的GridSearchCV。此外，讨论了连续和离散数据的评价指标，如R2 Score和accuracy_score，并提到残差正态分布检查和相关系数分析。最后，解答了关于训练集、测试集、校验集关系以及模型复杂度与预测误差的问题。

摘要由CSDN通过智能技术生成

一、模型评估

经过前面一系列的操作，我们得到了一个模型，但是如何评价这个模型好还是不好呢？

很简单，用数据测试一下。==>引发2个问题：数据从何而来？评价指标是什么？

【1】测试数据：测试集、校验集

（1）误差越小，模型越好。

（2）在校验集中，数据量不是很大时，会采用k折交叉验证。每折都会计算出一个超参数，最后超参数取平均值。

（3）sklearn中，交叉验证和网格搜索合并为一个参数：sklearn.model_selection.GridSearchCV。

只不过在线性模型中，留一交叉验证效果更好。在sklearn中，RidgeCV（岭回归）、LassoCV都是留一交叉验证。

（4）sklearn 还提供一个与LassoCV类似的LARS&

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。