Day37 机器学习算法基础 决策树 随机森林 总结1

目录

 

决策树概念

决策树信息论基础

信息熵

决策树的分类依据之一:信息增益

决策树划分的常见方式

决策树的api

实例:预测泰坦尼克号乘客信息,目标值其是否能存活survived

复习

导出决策树的分支图

决策树的优缺点

随机森林

随机森林api

实例分析泰坦尼克号

随机森林优缺点(比较全面缺点较少)

分类算法部分总结


决策树概念

相当于编程中的if-then结构,其实就是选择(右侧树的结构)

决策树信息论基础

信息是与消除不确定性相联系的(信息是为了消除不确定性)

  • 信息熵

32只球队,二分,只需要猜5次最多,就可以确定

因为32是2的5次方

  • 决策树的分类依据之一:信息增益

 

注:信息增益表示得知特征x的信息使得类Y的信息不确定性减少的程度,举例:得知年龄后对目标值(类别)是否同意贷款,的不确定性减少程度,也就是该项信息对结果的影响程度

此处计算的H(D)为总熵,H(青年)为青年中针对类别项的信息熵

最终分别计算了,年龄、工作、房产、信誉、等信息增益

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值