机器学习——基础知识篇

首先我们对机器学习模型的工作原理和使用方法有一个概括性的了解。如果你已经做过一些统计模型或者机器学习相关的工作,可能会觉得这太基础了,不过不要担心,我们很快就会构建一些强大的模型。

决策树模型

这个微课程将让你在熟悉以下场景后,构建模型。

你的堂哥已经花了数百万美元用于房地产的预测,由于你对数据科学非常感兴趣,他提供了一个与你进行商业合作对机会。将由他来出资,你来构建模型,预测不同房产的价值。

作为一个专业的挖掘工程师,你咨询了堂哥过去是如何预测房地产价值的。他告诉你都是通过直觉来预测的。但你又问了一些问题,这些疑问表明他已经从过去所见到的房地产中识别出了价格模式,并且他正是用这些模式对他正在考虑的房产进行估值的。

机器学习的工作原理也是这样。我们首先接触一个叫决策树的模型。当然,还有很多出色的模型能够给出更为准确的预测结果。但决策树模型易于理解,并且是数据科学中一些出色模型的基础组成模块。

为了简单起见,我们将从最简单的决策数开始。
在这里插入图片描述
这个决策树将所有房子分为两类。所考虑的任何房子的预测价格是该房子所属类别的历史平均价格。

我们用数据来决定如何将所有的房子分为2组,既而决定每个分组中的预测价格。从数据中捕捉模式的这一步就叫拟合或者训练模型。用于模型拟合的数据就叫做训练数据。

模型拟合的细节(包括如何对数据进行切分等),是一个比较复杂的过程,我们把它留到后面来解决。在模型拟合好后,你就可以用它来预测其他房子的价格了。

改进的决策树模型

通过拟合训练数据,以下这2棵决策树,哪一个更有可能产生呢?
在这里插入图片描述
很显然,左边的第一棵数更有意义一些,因为它捕捉出了这样一个现实:卧室多的房子价格通常要比卧室数少的房子价格高。但这个模型最大的缺陷是它无法捕捉到影响房子价格的多种因素,诸如浴室数、手数(一手还是二手)以及房子的地理位置。

你可以通过一棵拥有更多分支的树来捕获更多的房价影响因素。这种多分支的树被称为更深的树。
在这里插入图片描述
通过追踪决策树,你可以预测任何房子价格,只要选择与被预测房子特征相符合路径。房价的预测结果位于树的最底部,树底部用来预测的点,被称为叶子节点。

树的分支和叶子节点的值将由数据来决定,因此是时候来查看一下将要使用的数据了。
机器学习系列(二)https://blog.csdn.net/fwj_ntu/article/details/88419556

欢迎关注微信公众号:“数据分析师手记”,一起成长进步!
在这里插入图片描述

数据分析之家联合JEE RAY品牌为粉丝派发福利

在这里插入图片描述
添加粉丝福利派发官,领取粉丝福利哦

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值