样本为负被预测为正的应该用FP而不是FN。
这样理解 P 代表目前所有结果显示是 1
N 代表目前所有结果显示是 0
N=negative、P=positive、T=true、F=false。TF是预测为正负,NP为实际正负。
假设我们手上有60个正样本,40个负样本,我们要找出所有的正样本,系统查找出50个,其中只有40个是真正的正样本,计算上述各指标。
TP: 将正类预测为正类数 40 正确的正类
FN: 将正类预测为负类数 20 错误的负类
FP: 将负类预测为正类数 10 错误的正类
TN: 将负类预测为负类数 30 正确的负类
准确率(accuracy) = 预测对的/所有 = (TP+TN)/(TP+FN+FP+TN) = 70% 预测对的占所有的比例
精确率(precision) = TP/(TP+FP) = 80% 分类为正类的中真正的正类的比例
召回率(recall) = TP/(TP+FN) = 2/3 真正正确的正类预测正确的比例
正样本
总共 199
TP 正确的 148个
FN 错的的 52
负样本
总共 200 词
FP 正确的是 44
TN 错误的是 156
正确率 148+156/400 tp+tn/all 0.76
精确率 148/148+44 tp/tp+fp 0.739
召回率 148/148+52 tp/tp+fn 0.74
让正确的尽可能被认为是正确的 这是提高召回率 真正正确的被认为正确
让预测正确的结果中 更少的错的 这是提高精确率 被认为正确的中更多的真正确
那么一个错误的词就是一个正样本
召回率就是你预测为错误词中预测正确的个数除以所有事实上是错误词的个数
准确率就是你预测为错误词中预测正确的个数除以你所有预测为错误词的个数