决策树是附加概率结果的一个树状的决策图,是直观的运用统计概率分析的图法。机器学习中决策树是一个预测模型,它表示对象属性和对象值之间的一种映射,树中的每一个节点表示对象属性的判断条件,其分支表示符合节点条件的对象。树的叶子节点表示对象所属的预测结果。
这一节学习使用包party
里面的函数ctree()为数据集iris建立一个决策树
。属性Sepal.Length
(萼片长度)、Sepal.Width
(萼片宽度)、Petal.Length
(花瓣长度)以及Petal.Width
(花瓣宽度)被用来预测鸢尾花的Species
(种类)。在这个包里面,函数ctree()建立了一个决策树,predict()预测另外一个数据集。
在建立模型之前,iris(鸢尾花)数据集被分为两个子集:训练集(70%)和测试集(30%)。使用随机种子设置固定的随机数,可以使得随机选取的数据是可重复利用的。
#iris的决策树分析(二)install.packages("party")library("party") #导入数据包
str(iris)#集中展示数据文件的结构