Data Mining
wheatJH
前に進んでいる!
展开
-
Apriori、FP-Tree 关联规则算法学习
Apriori算法性质频繁项集的所有非空子集必须是频繁项集。支持度项集A、B同时发生的概率称为关联规则的支持度,也称相对支持度。置信度项集A发生,则项集B发生的概率称为关联规则的置信度。算法过程该算法根据最小支持度找出最大k项频繁集,再根据最小置信度,在频繁集中产生关联规则。找出最大k项频繁集扫描所有事务,事务中的每一项都是候选1项集C1的成员,计算每一项的支持度;对候选1项集C1中各项集的支持度...原创 2018-04-03 16:24:14 · 824 阅读 · 0 评论 -
ID3,C4.5,CART 决策树算法学习
ID3算法使用信息增益作为属性的选择标准,适用于离散的描述属性,且偏好于可取数目较多的属性。信息熵计算其中,pk代表第k类样本在D集合中所占的比重。信息熵越小,表示集合D的纯度越大。信息增益计算其中为集合D中某个属性的子集。根据所计算的信息增益,选取信息增益大的属性。C4.5算法在ID3算法的基础上,使用信息增益率作为属性的选择标准。该算法既能处理离散的描述属性,也能处理连续的描述属性,并且偏好于...原创 2018-04-02 20:49:00 · 292 阅读 · 0 评论