逻辑回归算法

应用的场景: 广告的点击率 , 是否为垃圾邮件, 是否患病等

从应用场景来看 逻辑回归解决的就是二分类的问题

  1. 原理

    输入值:线性回归的输出

在这里插入图片描述

激活函数: sigmoid函数

在这里插入图片描述

判断的标准:

  • 回归的结果输入到sigmoid函数中

  • 输出结果:[0,1]区间中的一个概率值,默认为0.5为阈值

在这里插入图片描述

  1. 损失

    线性回归逻辑回归
    最小二乘法对数似然

    分开类别:

在这里插入图片描述

​ 其中y为真实值,hθ(x)为预测值

​ 单个式子我们要根据log的函数图像来理解
在这里插入图片描述

​ 1.当y = 1时,我们希望hθ(x)值越大越好

​ 2.当y = 0时,我们希望hθ(x)值越小越好

​ 3.综合完整损失函数

在这里插入图片描述

​ 从上面的图例我们可以知道知道,log§, P值越大,结果越小,所以我们可以对着这个损失的式子去分析

3.优化

提升属于1的概率,降低0的概率

4.ROC曲线和AUC指标

  • TPR = TP / (TP + FN)

    • 所有真实类别为1的样本中,预测类别为1的比例
  • FPR = FP / (FP + TN)

    • 所有真实类别为0的样本中,预测类别为1的比例
  • ROC曲线

    • ROC的曲线面积就是AUC的值

    • 该曲线的横轴就是FPRate(伪正例),纵轴就是TPRate(真正例),如下图,当二者相等时,则表示,对于不论真实类别是1或者0的样本,分类器预测为1的概率是相等的,此时AUC为0.5

在这里插入图片描述

  • AUC指标

    • AUC的概率意义是随机取一对正负样本,正样本得分大于负样本得分的概率
    • AUC的范围在[0, 1]之间,并且越接近1越好,越接近0.5属于乱猜
    • AUC=1,完美分类器,采用这个预测模型时,不管设定什么阈值都能得出完美预测。绝大多数预测的场合,不存在完美分类器。
    • 0.5<AUC<1,优于随机猜测。这个分类器(模型)妥善设定阈值的话,能有预测价值。
    • 优点:
      • AUC非常适合样本不平衡的分类器性能
    • 缺点:
      • 只能用来评价二分类样本
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值