假如我们有个这样的网络:
第一层是输入层,包含两个神经元i1,i2,和截距项b1;第二层是隐含层,包含两个神经元h1,h2和截距项b2,第三层是输出o1,o2,每条线上标的wi是层与层之间连接的权重,激活函数我们默认为sigmoid函数。
其中,
输入数据 i1=0.05,i2=0.10;
输出数据 o1=0.01,o2=0.99;
初始权重 w1=0.15,w2=0.20,w3=0.25,w4=0.30,w5=0.40,w6=0.45,w7=0.50,w8=0.88
目标:给出输入数据i1,i2(0.05和0.10),使输出尽可能与原始输出o1,o2(0.01和0.99)接近。
Step 1:前向传播
1.输入层——>隐含层
h 1 = w 1 ∗ i 1 + w 2 ∗ I 2 + b 1 h1=w_1*i_1+w_2*I_2+b_1 h1=w1∗i1+w2∗I2+b1
h 1 = 0.15 ∗ 0.05 + 0.2 ∗ 0.1 + 0.35 h1=0.15*0.05+0.2*0.1+0.35 h1=0.15∗0.05+0.2∗0.1+0.35
神经元h1的激活:(此处用到激活函数为sigmoid)
a c t i v e h 1 = 1 e − h 1 = 1 1 + e − 0.3775 = 0.59326992 active_{h1}=\frac{1}{e^{-h1}}=\frac{1}{1+e^{-0.3775}}=0.59326992 activeh1=e−h11=1+e−0.37751=0.59326992
同理,可计算出 a c t i v e h 2 = 0.596884378 active_{h2}=0.596884378 activeh2=0.596884378
2.隐藏层——>输出层
计算出o1和o2
o 1 = w 5 ∗ h 1 + w 6 ∗ h 2 + b 2 o_1=w_5*h_1+w_6*h_2+b_2 o1=w5∗h1+w6∗h2+b2
o 1 = 0.4 ∗ 0.59326992 + 0.45 ∗ 0.596884378 + 0.6 = 1.105905967 o_1=0.4*0.59326992+0.45*0.596884378+0.6=1.105905967 o1=0.4∗0.59326992+0.45∗0.596884378+0.6=1.105905967
激活后
a c t i v e o 1 = 1 1 + e − 1.105905967 = 0.75136507 active_{o1}=\frac{1}{1+e^{-1.105905967}}=0.75136507 activeo1=1+e−1.1059059671=0.75136507
同理计算出o2
a c t i v e o 2 = 0.772928465 active_{o2}=0.772928465 activeo2=0.772928465
这样前向传播的过程就结束了,我们得到输出值为[0.75136079 , 0.772928465],与实际值[0.01 , 0.99]相差还很远,现在我们对误差进行反向传播,更新权值,重新计算输出。
step 2 反向传播
1.计算总误差
E t o t a l = ∑ 1 2 ( t a r g e