已知训练数据和训练数据类,获得决策树模型:
t=treefit(train_X,y);%train_X的行数为样本数,列数为特征数;y的行数为样本数,1列表征类;
t=classregtree(train_X,y):%用法与上一致,只是treefit为ID3算法,classregtree为CART算法;
现在多使用classregtree;
关于决策树的相关函数目前多放在classregtree的类中:
1)计算获得的决策树的精确度:
cost = treetest(t,'test',X,y);%测试错误率;
[cost,secost,ntnodes,bestlevel] = treetest(...);%cost为误差率向量;ntnodes为决策树包含的节点向量;两者对应
例:
% Start with a l