机器学习原理扫盲系列（二）逻辑回归如何实现多分类？

最新推荐文章于 2024-06-28 11:06:59 发布

鸡汤本汤

最新推荐文章于 2024-06-28 11:06:59 发布

阅读量668

点赞数 1

分类专栏：机器学习文章标签：机器学习逻辑回归算法

本文链接：https://blog.csdn.net/YangTinTin/article/details/104700418

版权

机器学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

三种方式

1、假设类别有n个，则每一种类别训练一个logistic分类器

每一个分类器能够区分某个类和其余的类。在进行预测的时候，使用n个分类器对样本进行预测，哪个类别的概率最大则将样本预测为这个类别。
优点：普适性好，多少类别训练多少分类器，效率较好
缺点：训练二分类器时，将一类样本标记为1，其余类别的所有样本标记为0，很可能会出现严重的样本不平衡问题，影响分类器的准确性。

2、假设有n个类别，则对于每两个类别就训练一个logistic分类器

这样总共要训练 $n * (n - 1) / 2$ 个分类器，在进行分类时使用投票方法，使用这些分类器对样本进行分类，分到哪个类别的次数最多就将样本判定为哪个类。
优点：不存在样本不平衡问题，性能相对稳定，训练的分类器多但相对简单，效率会有所提升
缺点：当类别很多时，需要训练的分类器呈平方级别增加。

3、修改逻辑回归的损失函数

将逻辑回归变为softmax回归。
原逻辑回归的损失函数：

$L=-\frac{1}{m}\sum_{i=1}^my_ilog(\hat{y_i})+(1-y_i)log(1-\hat{y_i})$

修改后的损失函数：

$L=-\frac{1}{m}\sum_{i=1}^m\sum_{j=1}^ny_{ij}log(\hat{y_{ij}})$
其中 $\hat{y_{ik}}=\frac{e^{x_k}}{\sum_{j=1}^ne^{x_j}}$

其中 $y_{ij}=0或1$ 当样本标签是j所代表的类别时， $y_{ij}$ =1,否则为0
举例：四分类
样本类别：[0,0,1,0]
预测：[0.1,0.1,0.6,0.2]
则 $\sum_{j=1}^ny_{ij}log(\hat{y_{ij}})$ 计算过程如下：
$\sum_{j=1}^ny_{ij}log(\hat{y_{ij}})=0*log(0.1)+0*log(0.1)+1*log(0.6)+0*log(0.2)$
注意：softmax这种方法适合于单标签多分类时，如果是多标签分类，还是前面两种方法比较好。