数据挖掘笔记(2)——分类、数值预测

分类-主要方法

决策树

    采用贪心策略以自顶向下的分治法构造决策树。        

    1. 选择样本集的一个属性作为根节点,为该属性的每个值产生一个分支

    2. 将每个分支递归使用其他属性进行划分,仅使用真正到达这个分支的样本

    3. 如果在一个节点上的所有样本都有相同的类别,即停止该部分树的扩展

基本问题

    1. 选择属性的顺序

       ID3     Information Galm  迭代的二分器

           标准:信息增益,哪个加入的信息多(熵的减少)

           通过特征划分数据,使用特征来建立模型,贪心选择哪个特征根据该划分产生的信息量。

       C4.5    Gain Ratio    ID3的后继

       CART   Gial Index    分类与回归树  使用gini选择属性

    2. 什么时候停止

       停止条件

       产生完全树后进行剪枝

优点

    1. 结构建立原理上可信,容易让人理解

 

遗传算法:

    进化计算:模拟生物中的进化,解决优化问题,包括进化策略、进化规划、遗传策略

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值