功能
classregtree的文档页面是不言自明的…
让我们来看一下分类树模型的一些最常见的参数:
> x:数据矩阵,行是实例,cols是预测属性
> y:列向量,每个实例的类标签
>分类:指定哪些属性是离散类型(而不是连续的)
>方法:是否生成分类或回归树(取决于类类型)
>名称:给出属性的名称
> prune:启用/禁用减少错误修剪
> minparent / minleaf:允许在节点中指定最小数量的实例,如果要进一步拆分
> nvartosample:用于随机树(考虑每个节点K个随机选择的属性)
权重:指定加权实例
> cost:指定成本矩阵(各种错误的罚分)
> splitcriterion:用于在每次拆分时选择最佳属性的标准.我只熟悉基尼系数指数,这是信息增益准则的变体.
> preprob:明确指定先验类概率,而不是从训练数据中计算出来
一个完整的例子来说明这个过程:
%# load data
load carsmall
%# construct predicting attributes and target class
vars = {'MPG' 'Cylinders' 'Horsepower' 'Model_Year'};
x = [MPG Cylinders Horsepower Model_Year]; %# mixed continous/discrete data
<