1. 多项逻辑斯蒂回归模型
多项逻辑斯蒂回归模型(multi-nominal logistic regression model),又称为Softmax Regression,是一个用来预测离散型随机变量的不同可能结果的概率的模型,用于进行多项分类。
前面在逻辑斯蒂回归原理推导与求解中讲到的逻辑斯蒂回归模型是二项分类模型,用于二分类。将其推广为多项分类,假设离散型随机变量的取值集合是
,那么多项逻辑斯蒂回归模型是(这也就是softmax函数,推导softmax函数详见参考文献1):
(1)
(1)式也就是,在已知参数和数据
的情况下,预测值
为类别
的条件概率。如果y=0,1,而且w0=0,那么就是逻辑回归的形式了。
将(1)式连乘得到在已知现有数据的条件下,是真正参数的概率,即似然函数:
(2)
由于乘法难解,通过对数可以将乘法转换为加法,简化计算。对数似然函数为:
(3)
其中,表示当第
个样本的分类为
时,返回1,否则为0。
似然函数表示样本成为真实的概率,似然函数越大越好,此时我们可以用梯度上升法求最大值,也可以引入一个负号转换为梯度下降法来求解。
代价函数为:
(3)
下面介绍逻辑斯蒂回归中梯度下降法求参数。
2. 梯度下降法求解
求偏导得到代价函数对于参数的梯度,对于每一个输出目标,
,其参数
的梯度是:
(4)
代表第
类的参数,是一个向量。
因此,在使用梯度下降法求解时,对于每一个,每次迭代地更新公式为:
(5)
参考文献: