一、什么是logistic回归?
logistic 回归又叫对数几率回归,适合数值型的二值型输出的拟合,它其实是一个分类模型,比如根据患者的医疗数据判断它是否能被治愈。
二、logistic回归数学原理与算法实现
我们考虑1个输入的
维数据
,我们对输入数据进行线性加权得到
前面说到,logistic回归用于而分类,假设得到的类别为0或者1,那么可以使用sigmoid函数处理输入,这个函数类似于阶跃函数但是又是连续型函数,看下这个函数长什么样
其实衡量的是输入数据
归属于类别 1 的概率,当
的时候,
,可以认为
归属于类别 0 的概率较大,当
的时候,
,可以认为
归属于类别 1 的概率较大。如果我们将线性加权得到的
作为 sigmoid 函数的输入,得到
这样就得到了输入数据
最终属于类别 1 的概率。
我们先考虑使用常规的均方差作为损失函数,这时候的损失函数为
采用梯度下降的方法对
进行更新,那么需要将损失函数对
求导得到
看到了吗?这里的梯度更新中包含了
,而通过 sigmod 函数可以发现,当
位于 0 或者 1附近的时候,导数值基本趋近于 0,梯度收敛速度极慢。
所以在这种情况下我们可以考虑使用交叉熵作为损失函数。将
作为输入数据 <