ZeroR分类器是一种最简单的分类器,这种方法仅仅根据历史数据统计规律,而选择一种概率最大的类别作为未知样本的分类结果,也就是说对于任意一个未知样本,分类结果都是一样的。ZeroR分类器简单的以多数类的类别(连续型数据使用简单均值)作为预测值。尽管这种分类器没有任何的预测能力,但是它可以作为一种与其他分类器的对比分类器。也就是说baseline performance。
算法描述:
为数据集建立一个频度表来选择一个频率最大的值。
例子:
模型:对于下面的数据集来说“Play Golf =Yes” 是ZeroR模型,精度为:0.64
预测性能:属性值也就是上面的预测指标(predictors)对于模型来说毫无贡献度。这是因为ZeroR根本就没有使用它们。
模型度量(Model Evaluation)
Confusion Matrix:
yes no
yes 9 0
no 5 0
所以预测精度为:0.64