深度学习入门基于python理论和实践读书笔记（三）_用python实现深度学习框架读书笔记-CSDN博客

本文链接：https://blog.csdn.net/jiangyutongyangyi/article/details/102898222

第三章神经网络第三四节

3.1和3.2讲的是矩阵非常基础的知识，这里就不复习了，线代学习的时候老师讲过。

神经网络内积

用numpy矩阵来实现神经网络，暂时忽略偏置和激活函数。如下示意图。
在这里插入图片描述

3层网络的实现

先定义符号，符号书上有一张图一看就会让读者很清楚。
在这里插入图片描述
加上偏置和权重，示意图是这样子的。

下一个神经元的表达式为：

如果使用矩阵乘法来表示：

python代码实现

import  numpy as np
X = np.array([1.0,0.5])
W1 = np.array([[0.1,0.3,0.5],[0.2,0.4,0.6]])
B1 = np.array([0.1,0.2,0.3])
print(W1.shape)
print(X.shape)
A1 = np.dot(X,W1)+B1

python实现前两层

import  numpy as np
from  activeFunction import sigmoid#我自己写的sigmoid函数
#ONE LAYER
X = np.array([1.0,0.5])
W1 = np.array([[0.1,0.3,0.5],[0.2,0.4,0.6]])
B1 = np.array([0.1,0.2,0.3])
print(W1.shape)
print(X.shape)
A1 = np.dot(X,W1)+B1
Z1 = sigmoid(A1)
print(A1)
print(Z1)
#TWO LAYER
W2 = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
B2 = np.array([0.1, 0.2])
print(Z1.shape) # (3,)
print(W2.shape) # (3, 2)
print(B2.shape) # (2,)
A2 = np.dot(Z1, W2) + B2
Z2 = sigmoid(A2)
print(A2)
print(Z2)

最后的输出层，只是激活函数不一样而已，其他步骤都是一样的。

def identity_function(x):
 return x #激活函数
W3 = np.array([[0.1, 0.3], [0.2, 0.4]])
B3 = np.array([0.1, 0.2])
A3 = np.dot(Z2, W3) + B3
Y = identity_function(A3) # 或者Y = A3
print(Y)

输出层的激活函数用σ()表示，藏层的激活函数用h()（σ读作sigma）。

总结的代码

import numpy as np
import activeFunction  as myfunctions #引入sigmoid等激活函数，函数是按照书上写的
def init_network():
    network = {}
    network['W1'] = np.array([[0.1, 0.3, 0.5], [0.2, 0.4, 0.6]])
    network['b1'] = np.array([0.1, 0.2, 0.3])
    network['W2'] = np.array([[0.1, 0.4], [0.2, 0.5], [0.3, 0.6]])
    network['b2'] = np.array([0.1, 0.2])
    network['W3'] = np.array([[0.1, 0.3], [0.2, 0.4]])
    network['b3'] = np.array([0.1, 0.2])
    return network
def forward(network, x):
     W1, W2, W3 = network['W1'], network['W2'], network['W3']
     b1, b2, b3 = network['b1'], network['b2'], network['b3']
     a1 = np.dot(x, W1) + b1
     z1 = myfunctions.sigmoid(a1)
     a2 = np.dot(z1, W2) + b2
     z2 = myfunctions.sigmoid(a2)
     a3 = np.dot(z2, W3) + b3
     y = myfunctions.identity_function(a3)
     return y
network = init_network()
x = np.array([1.0, 0.5])
y = forward(network,x)
print(y)