白话空间统计二十八:基于森林的分类和回归

好消息好消息,白话空间统计重出江湖了……只要998……八星八钻……文体两开花:

640?wx_fmt=jpeg

ArcGIS Pro 从2.2版本开始,推出了一个新的空间统计工具,叫做基于森林的分类和回归(Forest-based Classification and Regression):

640?wx_fmt=jpeg

第一眼看见这个的时候,我的内心那是崩溃的……多少年了啊,空间统计工具箱终于更新更新了啊!不过仔细一看,虾神我莫名的倒吸了一口凉气——不同于其他的空间统计工具(区别与经典统计学的各种空间特性),这个工具一直以来,是经典统计学里面的内容,而且还是目前大热的机器学习中的经典算法。

要讲清楚这个工具,写到这里的时候,虾神已经开始打退堂鼓了,这个工具后面涉及的理论是在太多了,单单是树和森林的概念,就足够写个十章八章的了。

640?wx_fmt=jpeg

不过后面一想,号称空间统计中的天劫GWR都让我啃完了(当然,里面还有不少坑没有填,嗯,我会装作啥都没看见的……),这个东东不就是多写几章,多做一些表情包的事情么,所以我决定,花上一段时间好好的把这个工具和后面的一些相关的技术和概念好好说一下。

如果对机器学习算法有兴趣的同学,可以关注一下。

分类和回归我就不多说了,特别是回归,以前写了不少文章,大家有兴趣可以看这里:

那么,这个基于树的xxx,什么是呢?

这个树,就是我们经常所说的——决策树。

决策树,首先是一棵树(废话……),在数据结构里面,可以是二叉树,也可以不是。

比如虾神买手机的时候,考虑的问题是这样的:

640?wx_fmt=jpeg

从上面这个图,就可以看出,虾神要买的手机,有下面这些特点:

1、屏幕要灰常灰常——最好是要背着包才能带出去那种。

2、速度要灰常灰常——看个视频都是二倍速的……

3、存储要灰常灰常——最好用到手机报废都不用清理存储空间

4、价格要灰常灰常便宜——起码不能超过虾神的笔记本。

上面这种结构,就是所谓的树:

树由节点组成。每个条件,就是一个节点,没有后续节点的节点,称之为叶子,节点与节点之间,由一个有向边连接。

比如虾神委托你去帮忙买手机,那么你拿到一个手机,只需要根据上面这棵树,就很容易知道是否是虾神需要的手机了。

决策树在计算机里面非常容易表示,用一系列的if ……else……语句,就能够轻易的表达一颗决策树了。那么这棵树,又与分类和回归有啥关系呢?

分类不用说了,根据这一系列的if……else……很容易分类出,哪些是虾神想买的手机,哪些不是;但是树与回归又怎么理解呢?我们一般理解的回归是:

640?wx_fmt=jpeg

树在回归里面,又有什么作用呢?

答案是,决策树可以卓有成效的在局部回归中使用:

640?wx_fmt=jpeg

局部回归就是把样本按照某种指标,划分成若干区域进行单独回归,这样决策树的就可以有效的在构建回归的时候,对窗口区域的选择起到非常有效的作用了。

下面我们来举一个例子:

比如,公司来了一位新人同事,我们要预测一下入职的这位新人同事的年龄——在没有任何其他条件的情况下,最简单方法就是按照目前公司的平均年龄来进行预测:

640?wx_fmt=jpeg

猜新人的年龄在28岁(左右),总比猜0-100岁靠谱吧……

在吃瓜群众们八卦的时候,HR路过的时候说了一句:

640?wx_fmt=jpeg

现在要按公司的平均年龄来预测,肯定就不准确了,所以我们就可以把数据分成三组:

640?wx_fmt=jpeg

新来的同事,是一位副总裁,那么现在猜的年纪,就应该在47岁左右比较合理了。

如果后面还有更详细的八卦,比如这位老总,以前在哪个单位干了多少年?或者是某政府部门正厅级官员下海来的等等,我们又可以细分出更多的分组,这要就可以更加准确的预测出他的年纪来了。

从上面的例子,可以看出,决策树可以通过条件的细分,构建更准确的分类方法,或者构建更细致的回归模型,达到更准确的预测和分类。

那么如何构造一棵决策树呢?我们下一章说。

待续未完。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

虾神说D

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值