我们首先把数据分为两部分: 正类别和负类别。 比如我们预测HIV 阳性的作为目标。那么HIV阳性的就是正类别。
- True Positives (TP) : 正确的预测为正类别。意思预测和实践标注都是HIV阳性。(正)
- True Negatives (TN) : 正确预测为负类别。 意思预测和标准都是HIV阴性。(负)
- False Positives (FP): 错误的预测为正类别。 意思预测是HIV阳性(正)。但是实际标注是HIV阴性。
- False Negatives (FN) : 错误的预测为负类别。 意思预测为Hiv阴性(负),但是标注实际为HIV阳性(正)。
简单总结下,就是说。
- 预测和实际标注一致的,我们称为TRUE.预测正确了。
- postive 和negative 指的是预测结果的是否是正类别。
- 假如要预测与实际不一致的。且预测为negative的。 那么很明显就是FN了。so easy!!!
准确率:
正确率是一个很重要的性能衡量的标准。正确分类占所有样本总数的比重。TP+TN / TP+TN+FP+FN
精确率:
在预测为正类的数据中。标注为正的数据所占的比例。 TP / TP+FP
召回率:
测试集中正类的数据中。 预测为正的数据占有的比例。 多少被正确的预测出来。 TP / TP+ FN
精确率和召回率,只是分母不同。 精确率是对预测为正类的数据来讲的。 召回率是实际标注为正类的作为分母的。