比如预测是否是癌症病人,假设1000个人里面只有一个,即比例分别为99.9%和0.1%。
这时如果设计的预测系统不经数据分析,全部预测为正常人,仍然会有99.9%的准确率。这显然是不合理的。所以就出现了precision、recall、Fscore这三个评估值。
定义如下:
根据定义,如果还是全部预测为正常人的话,上面precision和recall值就会都是0,便可以发现了系统设计的问题。
这时如果设计的预测系统不经数据分析,全部预测为正常人,仍然会有99.9%的准确率。这显然是不合理的。所以就出现了precision、recall、Fscore这三个评估值。
定义如下:
至于Fscore=2PR/(P+R),就是两个判断依据的权衡,用一个标准来衡量系统性能。