Kaggle竞赛入门（二）：如何验证机器学习模型

最新推荐文章于 2024-04-30 13:50:18 发布

Geeksongs

最新推荐文章于 2024-04-30 13:50:18 发布

阅读量251

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Geeksongs/article/details/105337860

版权

本文介绍了机器学习模型验证的重要性，特别是针对Kaggle竞赛中的决策树模型。通过平均绝对值误差（MAE）来评估模型性能，首先计算样本内得分，即使用全部数据进行训练和验证。然后，将数据集划分为训练集和验证集，以更准确地衡量模型的泛化能力。实验结果显示，未进行数据划分时的MAE明显高于采用验证集后的MAE，揭示了特征选择和模型优化的必要性。

摘要由CSDN通过智能技术生成

本文翻译自kaggle learn，也就是kaggle官方最快入门kaggle竞赛的教程，强调python编程实践和数学思想（而没有涉及数学细节），笔者在不影响算法和程序理解的基础上删除了一些不必要的废话，英文有的时候比较啰嗦。

一.什么是模型验证

模型验证在机器学习当中非常重要，因为有的时候拟合出来的模型误差非常大而自己却不知道，就会造成很大的失误。在kaggle竞赛入门（二）当中，我们利用决策树算法已经拟合出来了一个模型，那么如何去验证这个模型的准确性呢？那就是使用真实值和预测值的差值的绝对值来进行衡量,衡量一个点的误差的代码如下：

error=actual−predicted

但是我们的数据集当中有很多的点（数据），该怎么办呢？那就是对每一个点都做这样的减法，然后把所有error都加起来求出平均值，这个方法的简写叫MAE,因为它的英语是：Mean Absolute Error（平均绝对值误差）。为了能够计算MAE,我们首先需要一个模型，我们生成这个模型的代码如下（运用了决策树算法）：

# Data Loading Code Hidden Here
import pandas as pd

#

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。