正向传播，反向传播，矩阵求导

最新推荐文章于 2024-05-11 07:24:34 发布

机器不爱学习。

最新推荐文章于 2024-05-11 07:24:34 发布

阅读量1.2k

点赞数 4

文章标签：机器学习深度学习

本文链接：https://blog.csdn.net/weixin_44028135/article/details/109167217

版权

正向传播

正向传播是指数据X传入到神经网络，经过各个隐藏层得到最终损失值的过程。
本次就以逻辑回归模型为例讲解一下正向传播以及反向传播。
逻辑回归模型一般用来解决二分类问题， $\hat{y}=P(y=1 \mid x)$ 表示y = 1的概率，取值范围在[0,1]之间。引入线性模型：
$\hat{y}^{(i)}=w^{T} x^{(i)}+b$
其中 $w$ 是权重系数， $b$ 是个常数项， $w$ 的维度为 $\left(n_{x}, 1\right)$ ,可以看出该线性模型的输出区间为整个实数区间，而逻辑回归要求输出范围在[0,1]之间。所以我们需要引入Sigmoid激活函数，逻辑回归预测输出可以写为：
$\hat{y}=\operatorname{Sigmoid}\left(w^{T} x^{(i)}+b\right)=\sigma\left(w^{T} x^{(i)}+b\right)$
Sigmoid函数是一种非线性函数，它的表达式以及曲线如下图表示：
$\text { Sigmoid }(z)=\frac{1}{1+e^{-z}}$
在这里插入图片描述
Sigmoid函数导数表达式：
$\sigma^{\prime}(z)=\sigma(z)(1-\sigma(z))$
由函数曲线图可以看出，Sigmoid函数的输出范围在[0,1]之间，这样也就将逻辑回归的输出限定在[0,1]之间。常用的激活函数还有Tanh函数、Relu函数、Leaky Relu函数。
逻辑回归模型中， $w$ 和 $b$ 都是未知参数，需要通过反复训练优化得到最优值。因此，我们需要定义一个cost function，包含了参数 $w$ 和 $b$ 。通过梯度下降法优化cost function，当cost function取值最小时，得到对应的 $w$ 和 $b$ 。cost function定义为：
$\begin{array}{c} J(w, b)=\frac{1}{m} \sum_{i=1}^{m} L\left(\hat{y}^{(i)}, y^{(i)}\right)=-\frac{1}{m} \sum_{i=1}^{m}\left[y^{(i)} \log \hat{y}^{(i)}+\left(1-y^{(i)}\right) \log \left(1-\hat{y}^{(i)}\right)\right] \end{array}$

最低0.47元/天解锁文章

机器不爱学习。

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
正向传播，反向传播，矩阵求导

正向传播正向传播是指数据X传入到神经网络，经过各个隐藏层得到最终损失值的过程。本次就以逻辑回归模型为例讲解一下正向传播以及反向传播。逻辑回归模型一般用来解决二分类问题，y^=P(y=1∣x)\hat{y}=P(y=1 \mid x)y^=P(y=1∣x)表示y = 1的概率，取值范围在[0,1]之间。引入线性模型：y^(i)=wTx(i)+b\hat{y}^{(i)}=w^{T} x^{(i)}+by^(i)=wTx(i)+b其中www是权重系数，bbb是个常数项，www的维度为(nx,1
复制链接

扫一扫