线性回归与对数几率(Logistic)回归的区别与联系

最新推荐文章于 2022-08-27 12:10:15 发布

普通攻击往后拉

最新推荐文章于 2022-08-27 12:10:15 发布

阅读量4.8k

点赞数

分类专栏： NN技巧神经网络基础模型关键点

本文链接：https://blog.csdn.net/weixin_43483381/article/details/105230112

版权

神经网络基础模型关键点同时被 2 个专栏收录

18 篇文章 1 订阅

订阅专栏

NN技巧

13 篇文章 0 订阅

订阅专栏

1 线性回归

线性回归其实就是高中讲过的那种回归，但是不同的是线性回归在神经网络这里大多使用梯度下降来计算参数 $w, b$ ，而高中讲的是使用最小二乘法。
线性回归想解决的问题也是回归问题，公式：
$y = w x + b$
也可以写成：
$h_\theta(x) =\theta x$
用图形表示的话：

如果更新方式使用梯度下降，其中损失函数为：

$\frac{1}{2} \sum_i{(\hat{y_i}-y_i)^2}$
一个线性回归的输出点 $y$ 更像是一个没有激活的神经元，因此在pytorch里的普通神经网络层叫做nn.Linear(input, output, bias=True)。

2 Logistic回归

与线性回归相比，Logistic回归结构只是在其基础上多了一个激活的过程。
公式：
$h_\theta(x) = \frac{1}{1+e^{-\theta^T x}}$
用图形表示的话：

粉色代表一个非线性化过程。因为Logistic回归输出结果在(0,1)之间，往往用这个值做二分类，当输出 $y > 0.5$ 时，代表1类；当输出 $\leq 0.5$ 时，代表0类。
这里面除了结构的区别之外，还有一个地方有区别，那就是损失函数的表达式不同。因为Loss此时和 $\theta$ 的关系非线性程度较大，如果还使用平方差损失函数的话，就会比较麻烦（不是不行）。因此在Logistic回归中损失函数的公式为交叉熵：
$-ylog(h_\theta(x))-(1-y)log(1-h_\theta(x))$
这里用到了真实值 $y$ 只有两个取值 $0, 1$ ，使得计算过程得到了高效的转化。
一个线性回归的输出点 $y$ 更像是一个激活的神经元。这里有一个细节，Logistic回归翻译成汉语应该是对数几率回归，而不是逻辑回归。