- 博客(5)
- 资源 (5)
- 收藏
- 关注
原创 论文笔记3《基于信息增益和最小距离分类的决策树改进算法》
2013年《科学技术与工程》期刊部分摘要:改进后的算法针对决策树在分类过程中遇到的训练集中存在相同属性集,但属于不同类别的实例的情况,不再采用多数表决法判断叶结点的类别,而是采用基于信息增益的属性约简和最小距离分类的新方法进行类别的判断。算法改进:算法描述:(i) 先构造ID3决策树,但在构造的过程中对于具有相同属性集属于不同类别的实例,暂时用nu
2015-12-10 19:52:37 1126
原创 论文笔记2《决策树分类优化算法的研究---(下)》
实验结果:实验数据来源http://blog.csdn.net/txiaomiao/article/details/50219817中的天气预报数据集例子
2015-12-09 10:29:51 761
原创 论文笔记2《决策树分类优化算法的研究----(上)》
《硕士论文》 2010年部分摘要:ID3算法虽然很经典,但也有美中不足之处:第一,算法中使用了对数计算,而且计算过程复杂;第二,取值较多的属性被选择的机率比较大,即多值偏向问题。为了解决的这些问题,本文引入了泰勒公式和麦克劳林公式,对原算法进行化简,对于算法偏向于选取有较多取值的属性的缺点,用一个与属性取值个数相关的函数对简化后的属性信息增益进行修正。最后,用JAVA语言实现了改进前后的算法,
2015-12-08 21:07:46 1022
原创 论文笔记1《基于ID3决策树改进算法的客户流失预测分析》
《计算机科学》 2010年部分摘要:指出了该算法的取指偏向性以及运算效率不高等缺点,在此基础上提出了改进的ID3算法,该算法通过引入先验知识度参数,有效克服ID3算法中的取值偏向性和运算效率不高等问题。算法改进:针对传统的ID3算法的缺点与不足进行以下三点尝试性的改进。(1) 引入权重因子m,设属性A有n种取值,那么m=1/n(可根据经验设定);则G(A)=[I(p,n)-E(A
2015-12-08 15:45:07 1536
原创 信息增益、信息增益率、Gini
1、 C4.5继承了ID3的优点,并改进了:(1)使用信息增益率来选择属性,克服了用信息增益选择属性时偏向值多的不足;(2)在构树过程中进行剪枝;(3)能够完成对连续属性的离散化处理;(4)能够对不完整数据进行处理;2、 信息增益、信息增益率、Gini这三个指标均是决策树用来划分属性的时候用到的,其中信息增益(Info Gain)用于ID3,Gini用于CART,信息增益率(Info Ga
2015-12-08 15:42:10 6582
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人