第六章-6.1决策树

图1
对上决策树,采用C4.5进行裁剪。

通常C4.5采用C=25%的置信度来计算,对应的置信度标准差z=0.69,。对于误差率e的估计为:

                                    

其中,f为误差率f=E/N,E为错误分类数量,N为总数。

则有,图1中,健康计划-None的分支有4个bad(错误分类),2个good(正确分类),f=0.33,e=0.47;同理,健康计划-Half和健康计划-full的误差率e分别为0.72和0.47。组合误差率为:0.47*6/14+0.72*2/14+0.47*6/14=0.51。训练集健康计算共有9个bad(错误分类),5个good(正确分类),e为0.46,小于组合误差,因而节点被裁剪掉。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
模式分类PatternClassificationSecondEdition中译本-模式分类.part1.rar 计算机科学丛书——模式分类 Pattern Classification,Second Edition 中译本 ------------------------------------------------------------------------- 作者:(美)Richard O.Duda  Peter E.Hart  David G.Stork --------------------------------------------------------------------------------------------------------- 本书的第一版《模式分类与场景分析》出版于1973年,是模式识别和场景分析领域奠基性的经典名著。在第二版中,除了保留第一版的关于统计模式识别和结构模式识别的主要内容以外,读者会发现新增了许多近25年来的新理论和新方法,其中包括神经网络、机器学习、数据挖掘、进化计算、不变量理论、隐马尔可夫模型、统计学习理论和支持向量机等。作者还为未来25年的模式识别的发展指明了方向。书中包含了许多实例,各种不同方法的对比,丰富的图表,以及大量的课后习题和计算机练习。本书作为流行和经典的教材,主要面向电子工程、计算机科学、数学和统计学、媒体处理、模式识别、计算机视觉、人工智能和认知科学等领域的研究生和高年级本科生,也可作为相关领域科技人员的重要参考书。 --------------------------------------------------------------------------------------------------------- 图书目录: ------------ 出版者的话 专家指导委员会 译者序 前言 ------------- 第一章绪论 1.1机器感知 1.2一个例子 1.3模式识别系统 1.4设计循环 1.5学习和适应 1.6本章小结 全书各章概要 文献和历史评述 参考文献 ------------------------- 第二章贝叶斯决策论 2.1引言 2.2贝叶斯决策论连续特征 2.3最小误差率分类 2.4分类器判别函数及判定面 2.5正态函数 2.6正态分布的判别函数 2.7误差概率和误差积分 2.8正态密度的误差上界 2.9贝叶斯决策论 2.10丢失特征和噪声特征 2.11贝叶斯置信网 2.12复合贝斯决策论及上下文 本章小结 文献和历史评述 习题 上机练习 参考文献 ----------------------------------------------- 第三章最大似然估计和贝叶斯参数估计 3.1引言 3.2最大似然估计 3.3贝叶斯估计 3.4贝叶斯参数估计 3.5贝轩斯参数估计一般理论 3.6充分统计论 3.7维数问题 3.8成分分析和判别函数 3.9期望最大化算法 3.10隐马尔可夫模型 本章小结 文献和历史评述 习题 上机练习 参考文献 ---------------------- 第四章非参数技术 4.1引言 4.2概率密度的估计 4.3窗方法 4.4近邻估计 4.5最近邻规则 4.6距离度量和最近邻分类 4.7模糊分类 4.8RCE网络 本章小结 文献和历史评述 习题 上机练习 参考文献 -------------------------- 第五章线性判别函数 5.1引言 5.2线性判别函数和判定画 5.3广义线性判函数 5.4两类线性可分的情况 5.5威知器准则函数最小化 5.6松驰算法 5.7不可分的情况 5.8最小平方误差方法 5.9算法 5.10线性规划算法 5.11支持向量机 5.12推广到多类问题 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------------- 第六章多层神经网络 6.1引言 6.2前馈运算和划分 6.3反向传播算法 6.4误差曲面 6.5反向传播作为特征映射 6.6反向传播贝叶斯理论及概述 6.7相关的统计技术 6.8改进反向传播的一些实用技术 6.9二阶技术 6.10其他网络和训练算法 6.11正则化复杂度调节和剪枝 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------- 第七章随机方法 7.1引言 7.2随机搜索 7.3学习 7.4网络和图示模型 7.5进化方法 7.6规则 本章小结 文献和历史评述 习题 上机练习 参考文献 ---------------------- 第八章非度量方法 8.1引言 8.2判定树 8.3CART 8.4其他树方法 8.5串的识别 8.6文法方法 8.7文法推断 8.8基于规则的方法 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------------------------- 第九章独立于算法的机器学习 9.1引言 9.2没有天生优越的分类器 9.3偏差和方差 9.4统计量估计中的重采样技术 9.5分类器设计中的重采样技术 9.6分类器的评价和比较 9.7组合分类器 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------------------- 第十章无监督学习和聚类 10.1引言 10.2混合密度和可辩识性 10.3最大似然估计 10.4对混合正态密度的应用 10.5无监督贝叶斯学习 10.6数据描述和聚类 10.7聚类的准则函数 10.8迭代最优化 10.9层次聚类 10.10验证问题 10.11在线聚焦 10.12图论方法 10.13成分分析 10.14低维数据表示和多维尺度变换 本章小结 文献和历史评述 习题 上机练习 参考文献 ------------------ 附录A数学基础 参考文献 索引

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值