机器学习第一话：初识逻辑回归

最新推荐文章于 2024-07-23 16:44:14 发布

hyhpyx

最新推荐文章于 2024-07-23 16:44:14 发布

阅读量211

点赞数 1

分类专栏： # 机器学习

本文链接：https://blog.csdn.net/hyhpyx/article/details/115079600

版权

逻辑回归 sigmoid函数似然函数梯度下降参数解释

关键词由CSDN通过智能技术生成

机器学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

逻辑回归（Logistic regression）

什么是逻辑回归？

在我们以前的学习中，回归通常是指利用给定的样本信息 $X(x_1,x2,...,x_n)$ 建立一个回归表达式，例如:
$\beta_0x1+\beta1x2+...+\beta_nx_x$
最终我们得到是一个值 $\hat y$ 。对于预测某个样本是正例还是负例这种普通回归就不太适用，因为我们预测某个值是正例还是负例时，预测值 $\hat y$ 需要保证是在（0,1）范围内。
这时我们就需要使用逻辑回归。逻辑回归是一类经典的二分类算法，在使用机器学习算法时，我们一般使用简单的，若问题能得到很好的解决，那么就是用简单的，其次再考虑使用复杂的。

sigmoid函数

在正式介绍逻辑回归算法时，需要介绍一个辅助函数：sigmoid 函数。
公式： $\frac{1}{1+e^{-z}}$ .
其图像为：
sigmoid函数图像
函数值域为[0,1]，可将任意值映射到[0,1]区间中，实现由值到概率的转换，即可以用来实现分类任务。
其导数为： $\frac{dg(z)}{dz} =g(z)\times (1-g(z))$

逻辑回归参数求解

注：以下的 $l o g (x) = l n (x)$

似然函数

预测函数：
$h_\theta(X) =g(\theta^TX) = \frac{1}{1+e^{-\theta^TX}}$ ,
其中 $\theta^TX = \sum\limits_{i = 0}^n\theta_ix_i =\theta_0 +\theta_1x_1+...+\theta_nx_n$ .

对于分类任务而言： $h_\theta(X)$ 就是样本为1的概率。那么：
$1|X;\theta) =h_\theta(X)$
$0|X;\theta) =1-h_\theta(X)$ .
整合一下得到：
$P(y|X;\theta)=(h_\theta(X))^y(1-h_\theta(X))^{1-y}$

根据极大似然估计思想，为了解得参数向量 $\theta$ ，需要使似然函数最大。其中，似然函数如下：
$L(\theta) =\prod\limits_{i=1}^mP(y_i|X;\theta)=\prod\limits_{i=1}^m(h_\theta(x_i))^y_i(1-h_\theta(x_i))^{1-y_i}$ .
对数似然函数如下：
$l(\theta)=logL(\theta)=\sum\limits_{i=1}^m(y_ilogh_\theta(x_i)+(1-y_i)log(1-h_\theta(x_i)))$ .

参数更新

为了使用梯度下降法求解，引入 $J(\theta)=-\frac{1}{m}l(\theta)$ .

对 $\theta_j$ 求偏导：
$\frac{\delta J(\theta)}{\delta\theta_j} =\frac{1}{m}\sum\limits_{i=1}^m(h_\theta(x_i)-y_i)x_{ij}$
其中， $x_{ij}$ 表示第i个样本的第j个特征。
那么参数更新过程为：
$\theta_j=\theta_j-\alpha\frac{1}{m}\sum\limits_{i=1}^m(h_\theta(x_i)-y_i)x_{ij}$ .

参数解释

逻辑回归相较于其他的机器学习方法，其优点在于其参数可以明确解释。
$P$ 表示样本为正例的概率，则 $\frac{P}{1-P}$ 为胜率，
已知 $\frac{1}{1+e^{-\theta^TX}}$ ,那么：
$\frac{P}{1-P} =e^{\theta_0+\theta_1x_1+...+\theta_nx_n}$ ,
当 $x_1$ 变为 $x_1+1$ 此时概率为 $P^*$ ,则有
$\begin{aligned} \frac{P^*}{1-P^*} &=e^{\theta_0+\theta_1（x_1+1）+...+\theta_nx_n}\\ &=e^{\theta_0+\theta_1x_1+...+\theta_nx_n}\times e^{\theta1} \end{aligned}$
即在其他 $x$ 保持不变时，若 $x_1$ 增加一个单位，那么胜率就变为原来的 $e^{\theta_1}$ 倍。

hyhpyx

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习第一话：初识逻辑回归

逻辑回归（Logistic regression）什么是逻辑回归？在我们以前的学习中，回归通常是指利用给定的样本信息X(x1,x2,...,xn)X(x_1,x2,...,x_n)X(x1,x2,...,xn)建立一个回归表达式，例如:y=β0x1+β1x2+...+βnxxy = \beta_0x1+\beta1x2+...+\beta_nx_xy=β0x1+β1x2+...+βnxx最中我们得到是一个值y^\hat yy^。对于预测某个样本是正例还是负例这种普通回归就不太适用，因为我
复制链接

扫一扫