决策树最重要的2个问题:决策树的生长问题,决策树的剪枝问题。
生长问题又包括了2个子问题:从分组变量的众多取值中选择一个最佳分割点和从众多输入变量中选择当前最佳分组变量;
剪枝问题包括2个子问题:预修剪(事先指定树的最大深度,叶子的最小样本量等)和后修剪(先让树充分生长,然后边修剪边检验)。
CHAID:
install.packages("CHAID", repos=http://R-Forge.R-project.org)
地址:
http://r-forge.r-project.org/R/?group_id=343
CART:
Quest:
参考文献:
http://blog.csdn.net/yujun7654321/article/category/1249028
http://xccds1977.blogspot.com/2012/11/blog-post_28.html
http://cos.name/cn/topic/110320
http://blog.sina.com.cn/s/blog_5cfc31e00101bxfp.html
http://www.cnblogs.com/fengfenggirl/p/classsify_decision_tree.html