Multinomial 回归多分类推导

关于多分类问题,一般来讲有两种常见方法:1. one vs rest [“ovr”]; 2. Multinomial 回归。本文介绍的为第二种方式,即: 假设样本的目标变量服从Multinomial Distribution, 通过最大化目标变量的似然概率来求得模型的解。
摘要由CSDN通过智能技术生成

关于多分类问题,一般来讲有两种常见方法:1. one vs rest [“ovr”]; 2. Multinomial 回归。

本文介绍的为第二种方式,即:
假设样本的目标变量服从Multinomial Distribution, 通过最大化目标变量的似然概率来求得模型的解。

首先,我们假设样本的类别预测的概率分布函数 π 来表达,形式如下:

π(fij)=efijkefik(1)

其中: i 为样本编号, j 为类别编号, fij 为样本 i 在类别 j 上的得分, π(fij) 表示样本 i 归属到类别 j 的概率。

通过公式(1)不难发现该函数有如下性质:

  1. π(fij)0
  2. kj=1π(fij)=1
  3. π(fiv),   yiv=1 tends to be large

我们发现这是一个性质很好的函数,它其实是由最大熵原则(maximum entropy principle)推导得到,这里提一下,不做展开。

在得到了样本的预测结果后,使用交叉熵来衡量预测结果与实际结果的差距,并以此来构造损失函数,如下为样本 i 的损失函数:

L(i)=k[yikln(π(fik))](2)

同时由 IID 假设得到整体样本集的损失函数表示为:

Loss=iL(i)(3)

又因为,和的导数等于导数和,即:

Lossf
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: logistic回归是一种常用的分类方法,其中包括二元分类和多元分类。其中,二元分类是指将样本划分为两类,而多元分类则是将样本划分为多于两类。 在进行多元分类时,可以使用多项式逻辑回归(multinomial logistic regression)。这种方法与二元逻辑回归类似,但是在计算类间距离时使用的是多项式代价函数。 在进行多元分类时,可以使用多种评估方法来评估模型的效果。常用的方法有准确率(accuracy)、混淆矩阵(confusion matrix)、精确率(precision)、召回率(recall)和 F1 值(F1 score)。这些指标可以帮助我们了解模型在分类中的效果,并进行模型调优。 ### 回答2: 逻辑回归(Logistic Regression)是一种常用的分类算法,用于解决二分类问题。然而,在多分类问题中,我们需要使用多项式逻辑回归Multinomial Logistic Regression)来进行评估。 多项式逻辑回归是通过将多个二分类逻辑回归模型结合起来来实现多分类。具体而言,我们首先将类别之间进行两两组合,形成多个二分类模型。然后,对于每个二分类模型,利用逻辑回归的方法来拟合数据并计算得到决策边界。最后,通过将所有二分类结果进行综合,即可得到多分类问题的评估结果。 在使用多项式逻辑回归进行多分类评估时,我们需要注意以下几点: 1. 数据预处理:对于多分类问题,我们需要将类别变量进行独热编码,将其转换为二进制形式,以便逻辑回归模型能够正确处理多个类别。 2. 模型训练:对于多分类问题,我们需要同时训练多个二分类逻辑回归模型。一种常用的方法是使用一对多(One-vs-Rest)的策略,即将每个类别作为一个二分类问题的正类别,其他类别作为负类别,拟合对应的二分类模型。 3. 决策边界选择:在多分类问题中,需要确定不同类别之间的决策边界。一种常用的方法是使用 softmax 函数来进行类别概率的预测和划分。 4. 模型评估:对于多分类问题,我们可以使用准确率(accuracy)等指标来评估模型的性能。同时,可以绘制混淆矩阵(confusion matrix)来衡量模型在每个类别上的表现。 总而言之,多项式逻辑回归是一种常用的多分类评估方法。它通过结合多个二分类模型,对类别之间的决策边界进行建模,从而得到准确的多分类结果。 ### 回答3: Logistic回归多项式(Logistic Regression Multinomial)是一种常用的多分类模型评估方法。多分类是指将样本分为三个或三个以上的类别。Logistic回归多项式可以用于解决多分类问题,并对分类结果进行评估。 在Logistic回归多项式中,每个类别都与其他所有类别进行比较。这种方法使用了一个基础类别作为对比,然后将其他所有类别分别与该基础类别进行对比。对于每个类别,我们通过建立一个二分类的Logistic回归模型来对其进行评估。 在多分类评估中,我们通常使用混淆矩阵来评估模型的性能。混淆矩阵是一个二维矩阵,其行表示实际类别,列表示预测类别。矩阵的每个元素表示属于实际类别的样本数量被预测为该类别的数量。通过分析混淆矩阵,我们可以得出以下指标来评估模型的性能: 1. 准确率(Accuracy):准确率表示被正确分类的样本占总样本数的比例。当各类别样本数量相当时,准确率是衡量模型性能的重要指标。 2. 精确度(Precision):精确度表示被正确分类的正样本占所有被预测为正样本的比例。精确度可以衡量模型对正样本分类的准确性。 3. 召回率(Recall):召回率表示被正确分类的正样本占所有真正正样本的比例。召回率可以衡量模型发现所有真正正样本的能力。 4. F1-score:F1-score是精确度和召回率的调和平均值,用于综合评估模型的性能。 除了以上指标,我们还可以绘制ROC曲线和计算AUC来评估模型在不同阈值下的性能。 通过Logistic回归多项式的多分类评估,我们可以更全面地了解模型对各类别的分类能力,从而优化模型参数、特征选择以及改进其他建模方法。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值