我在创建混淆矩阵以将模型预测与实际值进行比较时遇到一些困难。我的数据集有159个解释变量,我的目标被称为“类别”。如何为决策树模型创建混淆矩阵
#Load Data
df
#Split into training and validation
index
training
validation
#Model
decisionTreeModel
#Predict
pred1
#Check model performance
confusionMatrix(validation$classe, pred1)
从上面的代码中生成以下错误消息:
Error in confusionMatrix.default(validation$classe, pred1) :
The data must contain some levels that overlap the reference.
我认为它可能有一些做与PRED1变量的预测函数生成,它与而5列的矩阵验证$ classe是一个有5个级别的因素。有关如何解决这个问题的任何想法?
在此先感谢
+0
您应该检查是否'$验证和classe''pred1'的因素,如果它们共享相同的水平( '水平(验证$ classe)'和'水平(pred1)'),也许在问题中分享结果。此外,如果您共享来自csv文件的数据样本,这将是一件好事。 –