三个有名的决策树算法:CHAID、CART和C4.5

未命名 未命名未命名

三个有名的决策树算法:CHAID、CART和C4.5
CHAID、CART和C4.5大概是决策树算法丛林中最有名,商业上运用也也最成功的算法了。CHAID (chi-squared automatic interaction detection,卡方自动交互检测)的前身是AID,主要特征是多向分叉,前向修剪,其标准如名所示,就是卡方检测;另外,CHAID只能处理类别型的输入变量,因此连续型的输入变量首先要进行离散处理。标准的CART(classification and regression trees)又不一样,它只能进行二部分叉,后向修剪,分割标准用的是基尼系数(Gini Index);C4.5源自有名的ID3,它只能进行L型分叉,后向修剪,标准乃是基于信息论的“熵”(Entropy)。

摘自:http://johnthu.spaces.live.com/blog/cns!2053CD511E6D5B1E!148.entry

展开阅读全文

没有更多推荐了,返回首页