前天用clementine 试了一次生成决策树,结果粗来只有一个根节点,如下图。
由于以前没有任何spss操作的经验,我的数据挖掘的知识仅限于课堂学过的 ID3算法,鉴于要上班,我没有时间跟着网络教程 一步一步学,如果决策树出不来,我的毕业论文就泡汤啦!!于是到处找答案,发帖求大神,没有答案。其间,我修改了数据类型、数据方向、模仿例子的流程,都没有成功。试着运行demo,demo是有正常结果的,说明不是clementine的问题。
我猜想问题出在数据上,可能样本量太少,或者数据源格式(我用的xls),所以我安装了spss statistic,把xls 改成 sav 和demo的数据源的格式相同,还是不行。可能真的是样本量太少,于是我把样本量增加到290多,(290个数据在一篇硕士论文中成功被生成决策树),结果还是没有节点!!!
啊,!!!!我快疯掉。就在快放弃之时,我突然想到,原因可能是修枝修太多!于是我去找相关参数设置,结果发现290个样本的成功案例的参数如下
对比我的参数(修剪严重性是75!!)。啊,问题八九不离十啦,改成0,执行,成功!!!完胜!!!我不用做假数据也能交毕业论文啦!!!
我还没了解修剪严重性的含义,写此贴帮助那些遇此问题一筹莫展的童鞋