1. 问题被研究的原因
1)在实际问题中,大多数分类问题,样本错分会带来不同的代价。那么我们就应该知道样本被错分的概率,或者说样本错分带来点的代价。
2)数据不平衡的情况下,比如所给样本几乎都是正例,那么此时分类正确率肯定很高,但是意义不大;因此只用一个p分类正确率是不够的。
2. 分类性能度量指标
2.1 混淆矩阵
1. 问题被研究的原因
1)在实际问题中,大多数分类问题,样本错分会带来不同的代价。那么我们就应该知道样本被错分的概率,或者说样本错分带来点的代价。
2)数据不平衡的情况下,比如所给样本几乎都是正例,那么此时分类正确率肯定很高,但是意义不大;因此只用一个p分类正确率是不够的。
2. 分类性能度量指标
2.1 混淆矩阵