机器学习中线性回归（linear regression）与逻辑回归（logic regression）简单推导)

最新推荐文章于 2024-04-04 20:07:24 发布

全村希望

最新推荐文章于 2024-04-04 20:07:24 发布

阅读量347

点赞数 2

分类专栏：机器学习文章标签：机器学习 tensorflow

本文链接：https://blog.csdn.net/weixin_43234878/article/details/103755232

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

机器学习中线性回归（linear regression）与逻辑回归（logic regression）简单推导

线性回归（linear regression）
逻辑回归（logic regression）
- 输入数据
- 推导准备工作

线性回归（linear regression）

线性回归在机器学习中是非常重要，也是非常基础的拟合方法。

输入数据表

$X^i$ \ $X_j$	$X_1$	$X_2$	$X_3$	$X_4$	$X_5$	…	$h_\theta(X^i)$	$y^i$
$X^1$
$X^2$
$X^3$
$X^4$
$X^5$
…

$\theta_j$	$\theta_1$	$\theta_2$	$\theta_3$	$\theta_4$	$\theta_5$	…

如上图所示有i个输入样本， $X^i$ 表示第i个样本。每个样本有j个特征值， $X_j$ 表示第j个特征值。 $y^i$ 表示第i个输入样本的目标值。 $\theta_j$ 为第j个输入特征的系数。线性回规的目的就是找出更好的 $\theta_j$ 以拟合目标值。

$h_\theta(X^i) = \theta_1 \cdot X_1+\theta_2 \cdot X_2+...+\theta_j \cdot X_j$

输入数据向量化

以表中数据的位置表示向量方向，则 $\vec{X^i}$ 为行向量， $\vec{X_j}$ 表示列向量， $\vec{\theta}$ 表示行向量。

$h_\theta(X^i) = \vec{X^i} \cdot \vec{\theta}^T$

举个例子

已知有m栋房子的面积，房间数，楼层数，是否邻河等各种特征数据，目标值是房子的售价。现在为了估算我家200平米三层小洋楼的售价，需要利用这m个输入数据与目标值来训练出系数 $\theta_j$ 以完成 $h_\theta$ 函数。

$X^i$ \ $X_j$	面积 $X_1$	房间数 $X_2$	楼层数 $X_3$	…	$h_\theta(X^i)$	售价 $y^i$
房1 $X^1$
房2 $X^2$
房3 $X^3$
…

线性回归的代价函数（省略向量箭头标志）

$J(\theta) = \frac{1}{2m}\sum_{i=1}^m (h_\theta(X^i)-y^i)^2$
此为均方差方程，前面出现二分之一是为了后面利用梯度递减算法时可以约去求导系数2。

梯度递减算法

利用梯度递减算法训练 $\theta$ （详细可参照网上其他资料，其中a为learning rate）。
$\theta_j=\theta_j-a\frac{\alpha}{\alpha\theta_j}J(\theta)$
将 $J(\theta)$ 代入后可得：
$\theta_j=\theta_j-\frac{a}{m}\sum_{i=1}^m(h_\theta(X^i)-y^i) \cdot X_j^i$
按照此公式将训练集迭代完后即可得到一系列较好的 $\theta$ ，并得到拟合函数 $h_\theta(X^i)$ 。

逻辑回归（logic regression）

本文中讨论比较基础的{0,1}逻辑。即目标值只有两种情况，是和不是。

输入数据

输入数据表与向量化和线性回归处相同，直接套用。

$X^i$ \ $X_j$	$X_1$	$X_2$	$X_3$	$X_4$	$X_5$	…	$h_\theta(X^i)$	$y^i$
$X^1$
$X^2$
$X^3$
$X^4$
$X^5$
…

$\theta_j$	$\theta_1$	$\theta_2$	$\theta_3$	$\theta_4$	$\theta_5$	…

若同线性回归中一样采用下面的求值方法
$h_\theta(X^i) = \vec{X^i} \cdot \vec{\theta}^T$
那么 $h_\theta(X^i)$ 就会就会出现大量偏离0,1的情况，所以需要一个activate function来将数据统筹在[0,1]范围内。本例中使用较常使用也比较基础的sigmoid函数。

$S(x)=\frac{1}{1+\rm e^{-x}}$
将 $X^i \cdot \theta^T$ 代入上式可得

$h_\theta(X^i)=\frac{1}{1+\rm e^{-X^i \cdot \theta^T}}$

以下是代价函数：
$J(\theta) ^i= \begin{cases} -ln(h_\theta(X^i)), & y^i=1 \\ -ln(1-h_\theta(X^i)), & y^i=0 \end{cases}$
而代价函数也可以使用其他的，其中理由太过深奥，没有深究。大佬可以继续探索。可以看出若 $y^i=1$ ， $h_\theta(X^i)$ 接近1时代价函数接近0；接近0时代价函数为无穷大。若 $y^i=0$ ， $h_\theta(X^i)$ 接近1时代价函数接近无穷大；接近0时代价函数接近0。

但是上式明显不利于求导，可以将两个方程并为一个

$J(\theta) ^i=-y^i \cdot ln(h_\theta(X^i))-(1-y^i) \cdot ln(1-h_\theta(X^i))$

总的代价函数为：
$J(\theta) =\frac{-1}{m}\sum_{i=1}^m \left(y^i \cdot ln(h_\theta(X^i))+(1-y^i) \cdot ln(1-h_\theta(X^i)) \right)$

同样利用梯度递减算法（gradient decrease）可得：
$\theta_j=\theta_j-\frac{a}{m}\sum_{i=1}^m(h_\theta(X^i)-y^i) \cdot X_j^i$
竟然和线性回归中的迭代公式一模一样惊不惊喜意不意外，下面列出推导过程。

推导准备工作

$h_\theta(X^i)=S(X^i \cdot \theta^T)$
对上式求偏导
$\frac{\alpha}{\alpha\theta_j}h_\theta(X^i)=S^{'}(X^i \cdot \theta^T) \cdot X^i_j$

使用sigmoid激活函数
$S(x)=\frac{1}{1+\rm e^{-1}}$
对激活函数求导
$S^{'}(x)=S(x) \cdot (1-S(x))$

$\frac{\alpha}{\alpha\theta_j}J(\theta) =\frac{-1}{m}\sum_{i=1}^m \left(\frac{y^i \cdot h^{'}_\theta(X^i)}{h_\theta(X^i)}+\frac{(1-y^i) \cdot h^{'}_\theta(X^i)}{h_\theta(X^i)-1} \right)$

$=\frac{-1}{m}\sum_{i=1}^m \frac{(h_\theta(X^i)-y^i) \cdot h^{'}_\theta(X^i)}{h_\theta(X^i) \cdot (h_\theta(X^i)-1)}$

最后将 $h^{'}_\theta(X^i)=S(X^i \cdot \theta^T) \cdot (1-S(X^i \cdot \theta^T)) \cdot X^i_j$ 以及
$h_\theta(X^i)=S(X^i \cdot \theta^T)$ 代入上式即可得结果。

全村希望

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
机器学习中线性回归（linear regression）与逻辑回归（logic regression）简单推导)

机器学习中线性回归（linear regression）与逻辑回归（logic regression）简单推导线性回归（linear regression）输入数据表输入数据向量化举个例子线性回归的代价函数（省略向量箭头标志）梯度递减算法逻辑回归（logic regression）输入数据推导准备工作线性回归（linear regression）线性回归在机器学习中是非常重要，也是非常基础的拟...
复制链接

扫一扫

专栏目录