代码chaid_经典决策树之SAS实现--CHAID

本文介绍了如何使用SAS/EM界面和R的CHAID包构建CHAID决策树,并通过比较SAS与R生成的决策树差异,探讨可能的原因。
摘要由CSDN通过智能技术生成

一、使用SAS/EM界面生成CHAID决策树

CHAID (Chi-Square Automatic Interaction

Detector)演算法為利用卡方分析(Chi-Square

Test)預測二個變數是否需要合併,如能夠產生最大的類別差異的預測變數,將成為節點的分隔變數。透過計算節點中類別的 P值

(P-Value),以P值大小來決定決策樹是否繼續生長,所以不需像C4.5或CART要再做決策樹修剪的動作。CHAID

與CART、C4.5

之差異在於,CHAID只限於處理類別變數,如連續變數必須採用區段的方式,轉換成類別變數。另一差異部分在於修剪的部分,CART、C4.5

是先過度套用資料訓練,之後再修剪。但CHAID 則是在過度套用之前即停止支點蔓生擴大。

二、通过R和SAS代码实现

样例数据来自 R 包,主要是想比较 R 和 SAS

生成的决策树是否相同。运行的结果确实不同,估计是运行参数的不同导致,仍有待研究。

1) Build CHAID tree using

R

# Train

data:

library(partykit)

library("CHAID")

data("BreastCancer", package = "mlbench")

# Build model:

ctrl

-1, alpha4 = 0.05,

minsplit=2, minbucket = 5, m

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值