MLP损失函数及反向传播算法

最新推荐文章于 2024-05-15 20:03:00 发布

komoreiii

最新推荐文章于 2024-05-15 20:03:00 发布

阅读量787

点赞数

文章标签：算法逻辑回归

本文链接：https://blog.csdn.net/qq_42403361/article/details/128001114

版权

1.多层感知机模型框架
在这里插入图片描述
多层感知机正向传播（forward propagation）

$a^2_1=f(\theta^1_{10}x_0+\theta^1_{11}x_1+\theta^1_{12}x_2+\theta^1_{13}x_3)=f(\theta^1x)=f(z^2_1)$
$a^2_2=f(\theta^1_{20}x_0+\theta^1_{21}x_1+\theta^1_{22}x_2+\theta^1_{23}x_3)=f(\theta^2x)=f(z^2_2)$
$a^2_3=f(\theta^1_{30}x_0+\theta^1_{31}x_1+\theta^1_{32}x_2+\theta^1_{33}x_3)=f(\theta^3x)=f(z^2_3)$

$y=f(\theta^2_{10}a^2_0+\theta^2_{11}a^2_1+\theta^2_{12}a^2_2+\theta^2_{13}a^2_3)=f(\theta^2x^2)=f(z^3_1)$
模型求解：寻找到合适的参数θ,使总样本预测y与实际y的误差总和最小。

2.损失函数：从逻辑回归到mlp
逻辑回归损失函数（J）
$J=\frac{1}{m}{\sum_{i=1}^mJ^{(i)}}=-\frac{1}{m}[\sum_{i=1}^m(y^{i}log(h(x^{i}))+(1-y^{(i)})log(1-h(x^{i})))]$

多层感知器损失函数损失函数（J）：
$J=\frac{1}{m}{\sum_{i=1}^m\sum_{k=1}^KJ^{(i)}}=-\frac{1}{m}[\sum_{i=1}^m\sum_{k=1}^K(y^{(i)}_klog(h(x^{i}))_k+(1-y^{(i)}_k)log(1-(h(x^{i}))_k))]$

梯度下降法寻找参数
$f(x)=\left\{ \begin{aligned} temp_{\theta_j}=\theta_j-\alpha\frac{\delta}{\delta\theta_j}J(\theta)\\ \theta_j=temp_{\theta_j} \end{aligned} \right\}$
以一个神经元为例：x=3，Y=10
$y=\theta_1x+\theta_0$
初始参数：θ 0=2，θ1=2，α=0.2

$J=|Y-y|=Y-(\theta_1x+\theta_0) =10-8=2$
$\theta_{01}=\theta_0-\alpha\frac{\delta J(\theta)}{\delta\theta_0}=2-0.2*（-1）=2.2\\ \theta_{11}=\theta_1-\alpha\frac{\delta J(\theta)}{\delta\theta_1}=2-0.2*（-3）=2.6\\$
$Y_1=2.6x+2.2=10$