在进行回归,决策树等出现报错,观察数据等情况都无发现错误
使用本地数据 鸢尾花(yuān wěi huā)做示例,说明问题
data(iris)
train_sub = sample(nrow(iris),7/10*nrow(iris))
trainset = iris[train_sub,]
testset = iris[-train_sub,]
fit1=rpart(iris$Species ~ . ,data=trainset)
注意这里 公式用了 . 代表4个自变量,然后就报错
报错内容下面这个
Error in model.frame.default(formula = iris$Species ~ . , data = trainset, :
变数的长度不一样(‘Sepal.Length’)
改成元素自变量对应的名称
顺利运行
fit1=rpart(iris$Species ~iris$Sepal.Length+iris$Sepal.Width +
iris$Petal.Length+iris$Petal.Width, data=trainset)