数据挖掘C4.5读后感

其实还没研究完 先来简单的记录下 自己的认识吧

 

 

C4.5主要是用来进行分类 从ID3算法演变来

 

下面主要将一下ID3算法:

 

首先是一个集合S,集合中的数据有着各种属性,对这些数据采用决策树进行分类。ID3算法就是解决如何选择属性的问题,采用的方法是熵的方法,就是说对于一个节点 计算它的熵 用它的熵减去它的第一级子集的熵,得到的数据 美其名曰 信息增益 结果就是这个量越大 就选作属性。一直递归的进行下去 结束条件1、这个分支上所有属性都包含了2、节点的熵计算为0(也就是叶节点) 上述条件满足一个就可以了。

 

由这个过程也可以看出 ID3算法的数据应该是离散型的 核心就是一个求决策树的公式,至于C4.5明天继续研究

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值