评价 Evalution
线上训练的正确率很高,但是线下却仍然效果很差达不到分类的标准可能的原因?
- 首先想到的应该是评价标准的问题
- 在负样本占99的情况下,如果评价指标选择正确率,那么分类器把所有结果都分配给负样本也会获得99的正确率。
- 线上线下样本不一致
- 测试集训练集划分不一致
- 模型存在过拟合/欠拟合
评价标准的基本知识
预测\GT | 真的是真 | 真的是假 |
---|---|---|
猜到是真 | T(true)P(预测正样本) | F(false)P(预测正样本) |
猜到是假 | F(false)N(预测负样本) | T(true)N(预测负样本) |
召回率又叫做TPR(true positive rate)
相对应的有FPR(false positive rate)
准 确 率 ( 猜 对 ∣ 在 猜 到 正 样 本 的 情 况 下 ) = T P T P + F P 召 回 率 ( 猜 对 ∣ 在 全 是 正 样 本 的 情 况 下 ) = T