数学公式推导_MLP反向传播算法_Multi_Layer Perceptron
简化公式
∂
E
∂
w
j
k
=
(
O
k
−
t
k
)
O
k
(
1
−
O
k
)
O
J
j
\frac{\partial E}{\partial w_{jk}}=\left( O_k-t_k \right) O_k\left( 1-O_k \right) O_{J}^{j}
∂wjk∂E=(Ok−tk)Ok(1−Ok)OJj
∂
E
∂
w
j
k
=
δ
k
K
O
j
J
\frac{\partial E}{\partial w_{jk}}=\delta _{k}^{K}O_{j}^{J}
∂wjk∂E=δkKOjJ
∂ E ∂ w i j = Σ k ∈ K ( O k − t k ) O k ( 1 − O k ) ∂ x k ∂ w i j \frac{\partial E}{\partial w_{ij}}=\underset{k\in K}{\varSigma}\left( O_k-t_k \right) O_k\left( 1-O_k \right) \frac{\partial x_k}{\partial w_{ij}} ∂wij∂E=k∈KΣ(Ok−tk)Ok(1−Ok)∂wij∂xk
∂
E
∂
w
i
j
=
Σ
k
∈
K
(
O
k
−
t
k
)
O
k
(
1
−
O
k
)
∂
x
k
∂
O
j
∂
O
j
∂
w
i
j
\frac{\partial E}{\partial w_{ij}}=\underset{k\in K}{\varSigma}\left( O_k-t_k \right) O_k\left( 1-O_k \right) \frac{\partial x_k}{\partial O_j}\frac{\partial O_j}{\partial w_{ij}}
∂wij∂E=k∈KΣ(Ok−tk)Ok(1−Ok)∂Oj∂xk∂wij∂Oj
∂
E
∂
w
i
j
=
Σ
k
∈
K
(
O
k
−
t
k
)
O
k
(
1
−
O
k
)
w
j
k
∂
O
j
∂
w
i
j
\frac{\partial E}{\partial w_{ij}}=\underset{k\in K}{\varSigma}\left( O_k-t_k \right) O_k\left( 1-O_k \right) w_{jk}\frac{\partial O_j}{\partial w_{ij}}
∂wij∂E=k∈KΣ(Ok−tk)Ok(1−Ok)wjk∂wij∂Oj
移项
∂
E
∂
w
i
j
=
∂
O
j
∂
w
i
j
Σ
k
∈
K
(
O
k
−
t
k
)
O
k
(
1
−
O
k
)
w
j
k
\frac{\partial E}{\partial w_{ij}}=\frac{\partial O_j}{\partial w_{ij}}\underset{k\in K}{\varSigma}\left( O_k-t_k \right) O_k\left( 1-O_k \right) w_{jk}
∂wij∂E=∂wij∂Ojk∈KΣ(Ok−tk)Ok(1−Ok)wjk
展开
∂
E
∂
w
i
j
=
O
j
(
1
−
O
j
)
∂
x
j
∂
w
i
j
Σ
k
∈
K
(
O
k
−
t
k
)
O
k
(
1
−
O
k
)
w
j
k
\frac{\partial E}{\partial w_{ij}}=O_j\left( 1-O_j \right) \frac{\partial x_j}{\partial w_{ij}}\underset{k\in K}{\varSigma}\left( O_k-t_k \right) O_k\left( 1-O_k \right) w_{jk}
∂wij∂E=Oj(1−Oj)∂wij∂xjk∈KΣ(Ok−tk)Ok(1−Ok)wjk
∂ E ∂ w i j = O j ( 1 − O j ) O i Σ k ∈ K ( O k − t k ) O k ( 1 − O k ) w j k \frac{\partial E}{\partial w_{ij}}=O_j\left( 1-O_j \right) O_i\underset{k\in K}{\varSigma}\left( O_k-t_k \right) O_k\left( 1-O_k \right) w_{jk} ∂wij∂E=Oj(1−Oj)Oik∈KΣ(Ok−tk)Ok(1−Ok)wjk
化简为
∂
E
∂
w
i
j
=
O
j
(
1
−
O
j
)
O
i
Σ
k
∈
K
δ
k
w
j
k
\frac{\partial E}{\partial w_{ij}}=O_j\left( 1-O_j \right) O_i\underset{k\in K}{\varSigma}\delta _kw_{jk}
∂wij∂E=Oj(1−Oj)Oik∈KΣδkwjk