介绍
在我最近的一个项目中,事务监控系统生成了大量误报警报(然后由调查小组手动调查这些警报)。我们被要求使用机器学习来自动关闭那些错误警报。机器学习模型的评估标准是一个度量负预测值(Negative Predicted Value),表示在模型的总负预测中,有多少个案例是正确识别的。
NPV = True Negative / (True Negative + False Negative)
我会快速显示混淆矩阵,下面是jupyter笔记本的输出。在二分类模型中,target=1是欺诈交易,target=0是非欺诈交易。
cm = confusion_matrix(y_test_actual, y_test_pred)print(cm)----- Output -----[[230, 33] [24, 74]根据解释混淆矩阵的不同方式,你会得到90%或76%的NPV。因为:
TN = cm[0][0] 或者 cm[1][1] 也就是 230 或者 74
FN = cm[1][0] 也就是 24
维基百科表示
我参考了维基百科中的混淆矩阵表示法。
这张来自