深度学习神经网络逻辑斯蒂回归模型

最新推荐文章于 2024-06-29 00:01:15 发布

苏丛JS

最新推荐文章于 2024-06-29 00:01:15 发布

阅读量528

点赞数 1

分类专栏：深度学习神经网络

本文链接：https://blog.csdn.net/qq_41077739/article/details/105712160

版权

深度学习同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

神经网络

3 篇文章 0 订阅

订阅专栏

神经元
二分类
多分类
目标函数
- 平方差损失
- 交叉熵损失
梯度下降
- 动量梯度下降

神经元

在这里插入图片描述
$h_{W, b}(x) = f(W^Tx) = f(\sum^{3}_{i=1}w_ix_i+b)$

$W$ 表示权重, 是一个向量
$w$ 表示 $W$ 中的元素
$x$ 表示特征
$f ()$ 表示激活函数
$b$ 是偏置, (如果没有 $b$ , 那么分类线或者分类面都必须经过原点), $b$ 可以看作 $W$ 中的 $w_0$ , 与图中的 +1 相乘

二分类

把激活函数应用到神经元上, 就可以得到一个二分类逻辑斯蒂回归模型

如果激活函数是 sigmoid, 即 $\frac{1}{1+e^{-x}}$ , 则
$h_{W}(x) = f(W^Tx) = \frac {1} {1+e^{-W^Tx}}$
$h_{W}(x) = \frac {1} {1+e^{-W^Tx}} \\ P(Y=1|x) = 1 - h_{W}(x) = \frac {e^{-W^Tx}} {1+e^{-W^Tx}} \\$
这两个式子可以看做是 $1$ 和 $e^{-W^Tx}$ 做归一化,
那么多分类就是 $1$ , $e^{-W^T_1x}$ , $e^{-W^T_2x}$ … $e^{-W^T_kx}$ 做归一化

多分类

在这里插入图片描述
再加一个神经元, 就可以做三分类(两个神经元各一类, 1减去两类为第三类)
也就是把 $W$ 从向量扩展为矩阵, $W_n$ 表示矩阵中的第 $n$ 个向量,
输出 $W * x$ 则变为向量

如果分为 $K$ 类

$\frac{e^{-W^T_kx}}{1+\sum^{k-1}_{1}e^{-W^T_k x}} \quad k=1,2,...K-1\\ P(Y=k|x) = \frac{1}{1+\sum^{k-1}_{1}e^{-W^T_k x}} \quad k=K$

举例:
$X = [3, 1, 2]$
$W = [[0.4, 0.6, 0.5], [0.3, 0.2, 0.1]]$
$W * X$ 得 $Y = [y_0, y_1] = [2.8,1.3]$
$e^{-Y} = [e^{-2.8}, e^{-1.3}] =[0.006, 0.27]$
$S u m = 1 + 0.06 + 0.27 = 1.33$
则
$P (Y = 0 ∣ x) = 0.06 / 1.33 = 0.045$
$P (Y = 1 ∣ x) = 0.27 / 1.33 = 0.203$
$P (Y = 2 ∣ x) = 1.00 / 1.33 = 0.752$

目标函数

平方差损失

$\frac{1}{n}\sum _{x,y}\frac{1}{2}(y-Model(x))^2$

$\frac{1}{2}$ 是为了求导方便
$y$ 需要做 one hot 编码

交叉熵损失

$\frac{1}{n}\sum_{x, y} yln(Model(x))$

梯度下降

$x_{t+1} = x_t - \alpha \triangledown f(x_t)$

$\triangledown f(x)$ 对 $x$ 求偏导
$\alpha$ 学习率

动量梯度下降

$v_{t+1} = \rho v_t + \triangledown f(x_t)\\ x_{t+1} = x_t - \alpha v_{t+1}$

$v_t$ 为之前梯度的积累值
$v_{t+1}$ 为之前梯度的积累值加上当前梯度的新的积累值
由于梯度是矢量, 所以他们的加法包括大小和方向
训练开始时, 动量积累得快, 可以加速训练
在局部极值附加震荡时, 可以借助动量跳出来
如果梯度方向发生变化, 动量能够缓解震荡

苏丛JS

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习神经网络逻辑斯蒂回归模型

神经元二分类多分类目标函数平方差损失交叉熵损失梯度下降神经元hW,b(x)=f(WTx)=f(∑i=13Wixi+b)h_{W, b}(x) = f(W^Tx) = f(\sum^{3}_{i=1}W_ix_i+b)hW,b(x)=f(WTx)=f(i=1∑3Wixi+b)WWW 表示权重xxx 表示特征f()f()f() 表示激活函数bbb 是偏置, 如图中的 +1, ...
复制链接

扫一扫