学习笔记自用,补充上篇【论文学习】的数学内容
Logistic回归
是一种常用的处理二分类问题的线性模型。为了解决连续的线性函数不适合进行分类的问题,引入非线性函数
来预测类别标签的后验概率p(y=1|x)
通常称为激活函数,把线性函数的值域映射到(0, 1)之间,表示概率,其逆函数被称为连续函数。标签的后验概率为
其中,分别为D+1维的增广特征向量和增广权重向量。标签的后验概率为
Logistic回归采用交叉熵作为损失函数,并且使用梯度下降法来对参数进行优化。给定N个训练样本,用logistic回归模型对每个样本进行预测,输出其标签为1的后验概率。因为,所以样本的真实条件概率可以表示为
使用交叉熵损失函数,其风险函数为
风险函数关于参数的偏导数为:
采用梯度下降方法,Logistic回归的训练过程为:初始化,然后通过下式来迭代更新参数
。是参数为时,Logistic回归模型的输出。
softmax回归
也称为多分类的Logistic回归,是Logistic在多分类问题上的推广。对于多分类问题,类别标签y∈(1, 2, 3, ... , C)可以有C个取值。给定一个样本x,Softmax函回归预测得到的属于类别c的条件概率为:
是第c类的权重向量。Softmax回归的决策函数可以表示为:.
可推断,决策函数
参数学习,采用交叉熵损失函数,计算梯度的公式及推导如下: