DataMining
文章平均质量分 81
Wang_Zhenwei
这个作者很懒,什么都没留下…
展开
-
DataMining学习1_数据挖掘技术(三)——关联分析
3、关联分析 3.1、基本概念 (1)通常认为项在事物中出现比不出现更重要,因此项是非对称二元变量。(2)关联规则是形如X->Y的蕴涵表达式,其中X和Y是不相交的项集,即X交Y=空。(3)由关联规则作出的推论并不必然蕴涵因果关系。它只表示规则前件和后件中的项明显地同时出现。(4)通常,频繁项集的产生所需的计算开销远大于规则产生所需的计算开销。(5)任何具有反单调性的度量都能够结合到数转载 2016-02-19 16:12:23 · 2325 阅读 · 0 评论 -
DataMining学习2_数据挖掘十大经典算法
数据挖掘十大经典算法 一、 C4.5 C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3 算法. C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进: 1) 用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足; 2) 在树构造过程中进行剪枝; 3) 能够完成对连续属性的离散化处理; 4) 能够对不完整转载 2016-09-14 10:26:28 · 3846 阅读 · 0 评论