【Kaggle_ML学习】4.Model validation

最新推荐文章于 2023-11-08 12:48:11 发布

餠藏

最新推荐文章于 2023-11-08 12:48:11 发布

阅读量349

点赞数

分类专栏： python machine learning 文章标签： python 机器学习

本文链接：https://blog.csdn.net/weixin_43749941/article/details/107665321

版权

【Kaggle_ML学习】4.Model validation文章目录【Kaggle_ML学习】4.Model validationWhat is Model Validation？1.MAEThe problem with 'In-sample' ScoresCoding It参考文献What is Model Validation？每次完成为某事物建立model之后，我们几乎每次都希望对其进行评估，而predictive accuracy就是我们对model质量评估的标准。在评估mode

摘要由CSDN通过智能技术生成

【Kaggle_ML学习】4.Model validation

1. What is Model Validation？

每次完成为某事物建立model之后，我们几乎每次都希望对其进行评估，而predictive accuracy就是我们对model质量评估的标准。
在评估model的predictive accuracy时，许多人都会犯的一个大错就是根据training data预测，然后却又用这个预测与training data中的targets value进行比较。（在这篇文章中，我们将会学习解决这个问题的方法，但在此之前，先看看这个错误是怎么做的）

对model进行评估时，我们需要将模型质量总结(改写)为一种方便理解的形式，比如当我们比较10,000个房子的预测价格和真实价格时，我们很可能会有一堆好的和坏的的混合预测值，然而列一张10,000行预测值和真实值的列表再进行查看是非常低效且没意义的，所以，我们需要将其写成一个单个的metric(指标/度量标准)
当然，我们有很多种metric来表示model的质量，但本篇文章会以Mean Absolute Error来举例(AKA MAE)
每一个房子的预测误差(prediction error)为：

error = actual - predicted

所以当一栋房子的实际价格为$150,000，而预测价格为$100,000时，error为$50,000

当使用MAE指标时，我们会取每个error的绝对值，然后再取所有这些absolute error的平均值

计算MAE时,当然第一步需要先建立一个model
(这里用的是DecisionTreeRegressor)

import pandas as pd

# Load data
melbourne_file_path = '../input/melbourne-housing-snapshot/melb_data.csv'
melbourne_data = pd.read_csv(melbourne_f

最低0.47元/天解锁文章

餠藏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【Kaggle_ML学习】4.Model validation

【Kaggle_ML学习】4.Model validation文章目录【Kaggle_ML学习】4.Model validationWhat is Model Validation？1.MAEThe problem with 'In-sample' ScoresCoding It参考文献What is Model Validation？每次完成为某事物建立model之后，我们几乎每次都希望对其进行评估，而predictive accuracy就是我们对model质量评估的标准。在评估mode
复制链接

扫一扫