当前浏览器不支持播放音乐或语音,请在微信或其他浏览器中播放
说实话,前面的决策树理论介绍的我自己都累,尤其是第一节各种公式的编辑;当然了,我深知数学理论对一切结论的支撑重要性,数学是这个世界上最美的语言。有了前面的铺垫,这里我们废话不多说,直接进入最终目标,基于R语言的两种经典决策树模型的实现。
这里用的数据集是R自带的应该是专门用来做决策树的训练数据集"Pima.tr"和测试数据集"Pima.te",因为这样可以保证人人都可以做模型实验。我本人觉得在这一点上R语言做的还是比较好的。
先看一下这两份训练与测试集的基本情况:
> head(Pima.tr)
npreg glu bp skin bmi ped age type
1 5 86 68 28 30.2 0.364 24 No
2 7 195 70 33 25.1 0.163 55 Yes
3 5 77 82 41 35.8 0.156 35 No
4 0 165 76 43 47.9 0.259 26 No
5 0 107 60 25 26.4 0.133 23 No
6 5 97 76 27 35.6 0.378 52 Yes
>