1. confusion matirx混淆矩阵
![](https://img-blog.csdnimg.cn/img_convert/197ff450b136f830b5da1c5b3db19dcf.png)
查准率(准确率):预测结果是正例的数据集中,实际正确的数量的比例
![](https://img-blog.csdnimg.cn/img_convert/b77b0f2a30c6a478aa9c11983b48d85b.png)
查全率(召回率):真实结果是正例的数据集中,被预测出是正确的数量的比例
![](https://img-blog.csdnimg.cn/img_convert/77760693f87e0366843c836a274c82d0.png)
-
2. P—R反向关系原理
查准率和查全率是一对矛盾的度量。一般来说,查准率高时,查全率往往偏低;而查全率高时,查准率往往偏低
![](https://img-blog.csdnimg.cn/img_convert/58bfa3c4faf9e2d9f3903c8d4c529d62.png)
例如:把门这个人严不严,这个人严的话,放过去的人就少,查准率也就高,但是能被放出来的人少了,因此查全率低;把门的人松的话,放过去的人特别多,鱼龙混杂,所以查准率也就低了,但是相应的查全率就高了
![](https://img-blog.csdnimg.cn/img_convert/47f0b8d79ba766c9666fefd74aa08c1d.png)
![](https://img-blog.csdnimg.cn/img_convert/3a4fe2db6ddc47ae748bd5750b30aa63.png)
3. 性能度量
若一个学习器的P—R曲线被另一个学习器的曲线完全"包住",则可以断言后者的性能优于前者,但是若果两个曲线发生了交叉,该如何比较?
-
3.1 最优阈值的确定
如何比较A,B,C三种模型的好坏,首先可以确定B和A优于C,BA之间优于交叉无法确定
首先会想到比较AB面积的大小,在一定程度上表征了模型的优劣,但是这个值不容易估算,曲线的解析式不易求
-
方法一:使用平衡点(Break—Even Point,简成BEP),R=P时R与P的值
为什么在PR曲线里面查全率为1,查准率为0?查准率为1时,查全率为0?什么情况会出现查全为1查准为0?
书上为假设已经训练了一个二分类器,对m个待测样本进行了预测,按照书上对P—R曲线的定义,我们得先把待测样本进行排序,把二分类器越有可能为正类的放前面,越有可能为负类的放后面
![](https://img-blog.csdnimg.cn/img_convert/fda90dcaf48944239965d1c021d86a9c.png)
-
方法二:F1度量,F1是基于查准率与查全率的调和平均定义的,
![](https://img-blog.csdnimg.cn/img_convert/9610501d8ce755e50f7b6a8f91032bf2.png)
-
方法三:Fβ(F1度量的一般形式),能让我们表达出对查准率与查全率的不同偏好,在一些应用中,对查准率与查全率的重视程度有所不同,例如在商品推荐系统中,尽可能地推用户感兴趣的,此时查准率更重要;而在逃犯检索系统中,尽可能少漏掉逃犯,查全率更重要
![](https://img-blog.csdnimg.cn/img_convert/da0ad1371ef49e19d24169d82ef050a8.png)
![](https://img-blog.csdnimg.cn/img_convert/1f870a3fe486b85c321dd1679ab3d418.png)
-
4. n个二分类实现的多分类问题
4.1先分别计算,再求平均值
![](https://img-blog.csdnimg.cn/img_convert/40537b0fb6f1d1f3e3fffdfb2712251f.png)
![](https://img-blog.csdnimg.cn/img_convert/2c9906941dec1ee4056d8746930827c1.png)
![](https://img-blog.csdnimg.cn/img_convert/19ab87940154e0c77a6605ea79506e53.png)
![](https://img-blog.csdnimg.cn/img_convert/8409248cd2e0c0b3474a4c34f8917dc6.png)
4.2先平均再计算
![](https://img-blog.csdnimg.cn/img_convert/f6bd3a327dd1229e9aaecc1aeaedda37.png)
![](https://img-blog.csdnimg.cn/img_convert/98fc3587bffb9616bdc107b553dbc7e0.png)
![](https://img-blog.csdnimg.cn/img_convert/59e2238de486b6c907a5345782903468.png)
![](https://img-blog.csdnimg.cn/img_convert/25c8dead270199b602638e824befb16f.png)