【机器学习微课程系列Level 1】1.1 模型是如何工作的-介绍

介绍

我们先大概了解机器学习模型的工作方式和使用方法。如果你之前有做过统计建模或者机器学习方面的工作,可能会觉得这节课程很基础。别担心,我们将会很快建立强大的模型。

本节微课程将会让你在以下场景建立模型:

你表哥做了几百万美元的房地产投机买卖。因为你对数据科学感兴趣,他提出想和你成为商业伙伴。由他提供资金,你提供房屋价值预测模型。

你问你表哥他之前是怎么做房地产价值预测的,他说凭直觉。但更多的怀疑表表明,他已经从过去的交易中找到了价格模式,并利用这个模式对新的房屋进行预测。

机器学习的工作原理也是如此。我们将从决策树模型开始学习,虽然有其他更复杂的模型能提供更精确的预测,但决策树比较容易理解,它是数据科学中一些其他最佳模型的基础。

简单起见,我们从最简单的可能决策树开始。
在这里插入图片描述
它把房屋分为两类,根据同类房屋的历史均价做出预测。

我们使用数据来决定如何将房屋分成两组,然后再确定每组的预测价格。从数据中获得模式的步骤,称为训练模型。用于训练模型的数据,称为训练数据。

训练模型的内部细节(例如怎样分隔数据)很复杂,我们以后再讨论。模型训练好之后,你可以将它运用到其他房屋价格的预测。

改进决策树

以下两个决策树,哪个更可能是通过训练房地产数据得到的?
在这里插入图片描述
左侧的决策树(决策树1)可能更有意义,因为它捕捉到了这样一个事实,即房屋的卧室越多,其价格更高。这种模式最大的缺点是,它没有捕捉到影响房价的大多数因素,例如浴室数量、地块大小、位置等。

可以用更多分来支捕捉更多因素,这样的决策树更深。加入了房屋总面积的决策树如下:
在这里插入图片描述
可以通过选择与房屋特征相对应的路径,来预测其他房屋的价格。房屋的预测价格在最底部,也叫叶子结点。

叶子的拆分和值,由数据决定。接下来我们开始检查和使用数据。

继续

让我们更具体一点,开始检查数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值