分类-1-逻辑回归（Logistic regression）、感知学习算法（perceptron learning algorithm）、牛顿迭代法

最新推荐文章于 2024-09-03 00:24:29 发布

yzheately

最新推荐文章于 2024-09-03 00:24:29 发布

阅读量3.1k

点赞数

分类专栏：机器学习打基础

本文链接：https://blog.csdn.net/yzheately/article/details/51044645

版权

机器学习同时被 2 个专栏收录

34 篇文章 2 订阅

订阅专栏

打基础

33 篇文章 0 订阅

订阅专栏

逻辑回归（Logistic regression）

我们现在只考虑二分类，即 $y\in \{0,1\}$ 。
类似于线性回归问题，我们同样定义一个估计（hypothesis）函数 $h_\theta(x)$ 。显然我们的输出值要限定在 $\{0,1\}$ 之间会更加有利。因此选择模型：

h θ (x) = g (θ T x) = 1 1 + e - θ T x w h e r e g (z) = 1 1 + e - z

$h_\theta(x)=g(\theta^Tx)=\frac{1}{1+e^{-\theta^Tx}}\\ where \qquad\qquad\qquad\qquad\qquad\qquad\\ g(z)=\frac{1}{1+e^{-z}}$
我们称上式为 logistic function或 sigmoid function.
下面给出

g(z)的曲线： $g(z)的曲线：$
这里写图片描述

显然，当z→∞时，g(z)→1;当z→−∞时，g(z)→0 $显然，当z\rightarrow\infty时，g(z)\rightarrow 1;当z\rightarrow -\infty时，g(z)\rightarrow 0$ 。
和之前一样，我们令

x0=1，这样我们类似的就得到θTx=θ0+∑nj=1θjxj $x_0=1，这样我们类似的就得到\theta^Tx=\theta_0+\sum^n_{j=1}\theta_jx_j$ 。

下面让我们来看看怎样得到 $\theta$ :
假设：这里写图片描述
上式可以合并为一个式子：

类似于我的这一篇博客中求最大似然值一样，我们可得：

进而得到log likehood:

然后还是一如既往的求导:
在求 $\ell(\theta)$ 关于 $\theta$ 的导数前，我们先来看看 $g(z)$ 的导数，因为在对 $\ell(\theta)$ 求导时会用到。
这里写图片描述
下面开始对 $\ell(\theta)$ 求导：

还记得梯度下降吗，不记得点这里，当时我们是为了求最小值。比较一下呢，现在我们是要求最大值，所以我们可以用梯度上升法求 $\theta$ ：

θ j : = θ j + α (y (i) - h θ (x (i))) x (i) j

$\theta_j:=\theta_j+\alpha\left (y^{(i)}-h_\theta(x^{(i)})\right )x_j^{(i)}$
可以看到，与线性回归类似，不同之处只是

θTx(i)在这里变成了hθ(x(i))，事实上hθ(x(i))就是由θTx(i)经过函数g(z)映射后得到的。 $\theta^Tx^{(i)}在这里变成了h_\theta(x^{(i)})，事实上h_\theta(x^{(i)})就是由\theta^Tx^{(i)}经过函数g(z)映射后得到的。$
扩展到整个样本集就是：