机器学习:查准率(Precision)和查全率(Recall)

类偏斜(skewed classes)情况表现为我们的训练集中有非常多的同一种类的实例,只有很少或没有其他类的实例。 
例如我们希望用算法来预测癌症是否是恶性的,在我们的训练集中,只有 0.5%的实例是恶性肿瘤。假设我们编写一个非学习而来的算法,在所有情况下都预测肿瘤是良性的,那
么误差只有 0.5%。然而我们通过训练而得到的神经网络算法却有 1%的误差。这时,误差的大小是不能视为评判算法效果的依据的。 
查准率(Precision)和查全率(Recall) 我们将算法预测的结果分成四种情况: 
1. 正确肯定(True Positive,TP):预测为真,实际为真 
2. 正确否定(True Negative,TN):预测为假,实际为假 
3. 错误肯定(False Positive,FP):预测为真,实际为假 
4. 错误否定(False Negative,FN):预测为假,实际为真  
则: 
查准率=TP/(TP+FP)例,在所有我们预测有恶性肿瘤的病人中,实际上有恶性肿瘤的病人的百分比,越高越好。 
查全率=TP/(TP+FN)例,在所有实际上有恶性肿瘤的病人中,成功预测有恶性肿瘤的病人的百分比,越高越好。 

这样,对于我们刚才那个总是预测病人肿瘤为良性的算法,其查全率是 0。 

 

降低阀值,提高Recall

提高阀值,提高Precision

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值