解决多分类问题有几种思路。有将多分类问题拆分成一系列二分类问题的OVR, OVO, ECOC算法。这些算法都比较直观而且容易理解,这里主要讲如何直接针对多分类问题建模。这篇文章将会把二元逻辑回归拓展成多分类的逻辑回归。
我们自然地从多类别逻辑回归公式中推导出交叉熵损失函数,理解交叉熵损失函数的由来。
一、多类别逻辑回归( Multinomial logistic regression )
我们之间讲解了针对二分类问题的逻辑回归基本模型:折射:逻辑回归 Logistics regressionzhuanlan.zhihu.com
回顾一下逻辑回归模型的表达式:
判别一个数据
的标签,假设标签属于{1, 2}可以写成:
将权重替换成两个权重,令
,代入上式:
可以看到,这些函数的底都是一样的,属于第一类的概率正比于
,属于第二类的概率正比于
,因此能够自然联想到,对于多类的情况,第 k 类的概率正比于