Kaggle教程 机器学习入门1 模型是怎样工作的

转载请注明出处:https://leytton.blog.csdn.net/article/details/101154693
如果本文对您有所帮助,请点个赞让我知道哦 😃

《Kaggle教程 机器学习入门》系列课程目录
Kaggle教程 机器学习入门1 模型是怎样工作的
Kaggle教程 机器学习入门2 数据探索
Kaggle教程 机器学习入门3 你的第一个机器学习模型
Kaggle教程 机器学习入门4 模型验证
Kaggle教程 机器学习入门5 欠拟合与过拟合
Kaggle教程 机器学习入门6 随机森林
Kaggle教程 机器学习入门7 继续你的征程

1、简介

我们将首先概述机器学习模型如何工作以及如何使用它们。如果你以前做过统计建模或机器学习,这可能会让你觉得很基础。别担心,我们很快就会建立强大的模型。

这门微课程将用以下场景为例来构建模型:

你的表哥在房地产投机上赚了几百万美元。由于你对数据科学的兴趣,他愿意成为你的商业伙伴。他会提供资金,你负责提供模型来预测各种房子的价值。

你问表哥他过去是如何预测房产价值的,他说只是凭直觉。但更多的问题表明,他从过去看到的房子中总结出价格模式,并利用这些模式对他当前考虑的新房做出预测。

机器学习也是如此。 我们将从一个叫做决策树的模型开始说起。当然还有更神奇的模型可以提供更准确的预测,但是决策树很容易理解,它们是数据科学中一些最佳模型的基本构件。

为了简单起见,我们将从最简单的决策树开始。
First Decision Trees

如上图所示,它将房子只分为两类。房子的预测价格是同类房子的历史平均价格。

我们使用数据来决定如何把房子分成两组,然后再确定每组的预测价格。从数据中捕获模式的这一步骤称为拟合训练模型。用于拟合模型的数据称为训练数据

模型拟合的过程(例如,如何分割数据)比较复杂,我们以后再提。在模型被拟合之后,你可以将其应用于预测新房的价格。


2、改进决策树

以下两种决策树中,哪一种更有可能来自于房子训练数据的拟合?
在这里插入图片描述
左边的决策树可能更有意义,因为它考虑一个事实:卧室多的房子往往比卧室少的房子售价更高。但这个模型没有考虑到影响房价的其他因素,比如卫生间的数量,地段大小,位置等。

你可以使用更多“分叉”的决策树来考虑其他影响因素,即“更深”的树。一个决策树也考虑了每栋房子的总占地面积,看起来可能是这样的::
在这里插入图片描述
只要沿着满足条件的分支进行选择,你可以通过跟踪决策树来预测任何房子的价格。房价将在决策树的底部点得出,我们将这个点叫做叶节点

叶子处的分支和值将由数据决定,接下来将检查你用到的数据。

3、后续

接下来我们将详细讲解怎么检查你的数据。

原文:
https://www.kaggle.com/dansbecker/how-models-work

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值