机器学习-决策树(求最优信息增益)

本文介绍了决策树的概念,通过一个相亲对象选择的例子来帮助理解。决策树的构建涉及计算信息增益,以确定最佳特征划分。文章详细说明了如何计算熵,表示标签取值的随机性,并提供了数据集创建、熵计算及信息增益求解的步骤。
摘要由CSDN通过智能技术生成

emmmmmm....有点烧脑子

决策树,通俗的理解就是根据每个问题进行判断,然后最终往下找到答案的过程,类似于一棵树,可以用下图(相亲对象的选择)来理解:

 

获得一棵决策树,首先要求的最优信息增益,信息增益就是求前边每一列对最最后一列这个可能标签的约束程度,熵代表了最后一列标签取值的随机性(貌似这样吧,我是小渣渣自己这样理解的,头都大了),下图可以看出每种信息增益的情况,可以理解为用哪种特征划分比较合适:

数据集,前四列为 '年龄', '有工作', '有自己的房子', '信贷情况',最后一列为是否贷款给这个人

 

下列代码可以分为几个步骤:

1.创建如上数据

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值