第二章:模型评价与损失函数

第二章:模型评价与损失函数

  • 要点一: 逻辑回归模型对样本的预测取决于权值向量偏置

  • 概念:

    序号概念解释
    1训练集包含真实类别标签的样本集
    2训练根据训练集寻找最优参数的过程
    3损失函数是模型参数的函数,用于衡量模型参数的优劣
  • 逻辑回归预测样本x = (x1 ,x2, x3,……,xn)T 属于正类的概率 P

    f ( x ) = 1 1 + e − b − w T x f(x) = \frac{1}{1+e^{-b-w^{T}x}} f(x)=1+ebwTx1

    • 其中,w和b是模型的参数,训练的过程就是寻找这两个参数。
  • 混淆矩阵

    预测负类预测正类
    真实负类TNFP
    真实正类FNTP
  • 正确率

    • 正确率的计算公式:

      a c c u r a c y = T N + T P T N + T P + F N + F P accuracy = \frac{TN+TP}{TN+TP+FN+FP} accuracy=TN+TP+FN+FPTN+TP

      正确率是模型预测正确的样本数与总样本数之比。其并不总是可靠的,例如正例:负例=99:1,预测结果为全 正,此时的正确率为99%。

    • 查准率:

      • 又称准确率(precision),公式如下:

        p r e c i s i o n p = T P T P + F P precision_p = \frac{TP}{TP+FP} precisionp=TP+FPTP(正类)

        p r e c i s i o n p = T N F N + T N precision_p = \frac{TN}{FN+TN} precisionp=FN+TNTN(负类)

        由公式可知,正确预测正类样本数量和预测正类样本总数量之比。负类同。

  • 查全率:

    • 查全率又称召回率:recall

      r e c a l l p = F P F P + T N recall_p = \frac{FP}{FP+TN} recallp=FP+TNFP

      此公式意味着,预测为正类的样本数与全部正类样本数之比。又称真阳率TPR,true positive rate)与之相对应的有假阳率FPR,false positive rate):

      F P R = F P F P + T N FPR= \frac{FP}{FP+TN} FPR=FP+TNFP

  • ROC曲线

    • 在逻辑回归中,假设我们已经得到了一组w与b,所以我们可以把测试集中的数据代入f(x)进行预测,代入函数后我们得到的是一个介于0和1之间的一个数,为了实现预测,我们需要一个阈值,我们将f(x)大于阈值的测试数据视为正类,否则为负类。
    • 所以阈值的选取将直接的影响到我们的逻辑回归模型的好坏。
    • 假阳率FPR与真阳率这对指标随阈值变化同升同降。高TPR和低FPR是我们希望的。
    • ROC曲线如图
    • img
    • 以FPR为横轴、TPR为纵轴,将不同阈值对应的ROC曲线画出来。ROC曲线上拱越高,说明在较低处的FPR处有更高的TPR。
    • ROC曲线下的面积,AUC(area under curve)可以衡量模型的质量。

下一节将发布损失函数的计算方法

后续还有梯度下降法求解逻辑回归,梯度下降法的改进等内容,届时为大家奉上手写逻辑回归代码

感谢关注

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Ambrosedream

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值