1. 准确率(Accuracy):
- 准确率是最常见的评价指标之一,但在不平衡数据中可能不够准确。
2. 精确率(Precision)和召回率(Recall):
- 精确率(Precision):TP / (TP + FP),其中 TP 是真正例,FP 是假正例。
- 召回率(Recall):TP / (TP + FN),其中 FN 是假负例。
3. F1分数:
- F1分数综合了精确率和召回率,是它们的调和平均值。
- F1 = 2 * Precision * Recall / (Precision + Recall)
4. 面积受限制的ROC曲线下的面积(AUC-ROC):
- AUC-ROC表示模型在不同分类阈值下真正例率与假正例率之间的权衡。
5. 马修斯相关系数(MCC):
- MCC是一个综合考虑了四个分类结果的指标,对于不平衡数据集具有鲁棒性。
6. 加权准确率(Weighted Accuracy):
- 将每个类别的准确率按照类别的样本比例进行加权求和。
7. 混淆矩阵(Confusion Matrix):
- 混淆矩阵提供了一个清晰的视角,展示了模型在每个类别上的表现。
选择适当的评价指标取决于具体的问题和关注的任务,有时可能需要综合考虑多个指标以全面评估分类器的性能。在处理不平衡数据时,特别重要的是关注与任务目标相关的指标,并理解不同指标之间的权衡关系。