线性判别函数

性能度量

在这里插入图片描述

在这里插入图片描述

查准率和查全率

在这里插入图片描述

P-R曲线

在这里插入图片描述

理解P-R(查准率-查全率)

如果我们想要根据这个概率判断用户好坏的话,就必须定义一个阈值。超过阈值就判定为A,否则,判定为B。为了得到这个最合适、使结果最准确的阈值,我们需要遍历所有的阈值,而每个阈值对应一查准率和查全率,因此,得到了P-R曲线。
什么是最好的阈值点?我们期望查全率和查准率都较高,但二者矛盾,无法达到两全其美,因此,根据特定情况,偏向一些查全率或偏向查准率。

F1 度量

查全率和查准率的一个平衡点。
在这里插入图片描述

ROC图

TPR(真正率) = TP/(TP+FN)

FPR(假正率) =FP/(FP+TN) 有多少负样本被错误地预测为正样本

在这里插入图片描述

直接看矩阵好记忆。
TPR和FPR分别是基于实际表现1和0出发的,也就是说它们分别在实际的正样本和负样本中来观察相关概率问题
所以无论样本是否平衡,都不会被影响
如果我们从实际表现的各个结果角度出发,就可以避免样本不平衡的问题了,这也是为什么选用TPR和FPR作为ROC/AUC的指标的原因。

在这里插入图片描述

ROC曲线也是通过遍历所有阈值来绘制整条曲线的

若某个学习器的ROC曲线被另一个学习器的曲线“包住”,则后者性能优于前者;否则如果曲线交叉,可以根据ROC
曲线下面积大小进行比较,也即AUC值.
AUC越高效果越好,真正率高,假正率小

代价敏感错误率

为了权衡不同类型错误所造成的不同损失,可为错误赋予“非均等代价”。
在这里插入图片描述
在这里插入图片描述

Fisher线性判别

Fisher判别的基本思想:
希望投影后的一维数据满足:

  • 类之间的距离尽可能远; 
  • 每一类自身尽可能紧凑。 
    准则的描述:用投影后数据的统计性质—均值和离散度的函数作为判别优劣的标准。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值