机器学习-决策树

有不足之处,请大家指正,谢谢!微笑

机器学习中,决策树是一个预测模型;他代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决策树仅有单一输出,若欲有复数输出,可以建立独立的决策树以处理不同输出。 数据挖掘中决策树是一种经常要用到的技术,可以用于分析数据,同样也可以用来作预测。

从数据产生决策树的机器学习技术叫做决策树学习,通俗说就是决策树。

一个决策树包含三种类型的节点:

  1. 决策节点:通常用矩形框来表式
  2. 机会节点:通常用圆圈来表式
  3. 终结点:通常用三角形来表示

以上资料参考http://zh.wikipedia.org/wiki/决策树

    构造决策树,我们需要找到决定性的特征,以划分最好的结果,因此,需要对每个特征进行评估,如果某个特征的信息增益最大,那么该特征就是最好的分离点。
1、 如果检测数据集中子项是否属于一类,则返回该子类标签;
2、否则,寻找该子类中的最好特征,划分数据,创建支点;
3、返回步骤1,继续检测下一支点;
     
熵的定义如下:(参考http://zh.wikipedia.org/wiki/信息熵)

一个值域为{ x1, ..., xn}的随机变量 X 的熵值 H 定义为:

                                       H(X)  =  \operatorname{E}(I(X))

其中,E 代表了期望函数,而 I(X) 是 X 的信息量(又称为

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值