机器学习系列专栏
选自 Python-Machine-Learning-Book On GitHub
作者:Sebastian Raschka
翻译&整理 By Sam
讲完了很多模型选择和调参的方法,那么评价指标就差不多要派上用场了,不同的模型对应着不同的评价指标,这个需要有一个意识,应该不同的评价指标选择出来的最优模型都是不一样的,所以还是需要根据具体的业务需求来选择适合自己模型的评价指标。
而讲评价指标,都是先要了解一下 混淆矩阵。
混淆矩阵,大家应该都有听说过,大致就是长下面这样子的:
所以,有几个概念需要先说明:
TP(True Positive): 真实为0,预测也为0
FN(False Negative): 真实为0,预测为1
FP(False Positive): 真实为1,预测为0
TN(True Negative): 真实为1,预测也为1
所以,衍生了几个常用的指标:
: 分类模型总体判断的准确率(包括了所有class的总体准确率)
: 预测为0的准确率
: 真实为0的准确率
: 真实为1的准确率
: 预测为1的准确率
: 对于某个分类,综合了Precision和Recall的一个判断指标,F1-Score的值是从0到1的,1是最好,0是最差
: 另外一个综合Precision和Recall的标准,F1-Score的变形
再举个例子:
混淆矩阵网络上有很多文章,也不用说刻意地去背去记,需要的时候百度一下你就知道。
—End—