题目:
这部分,你需要实现一个可以识别手写数字的神经网络。神经网络可以表示一些非线性复杂的模型。权重已经预先训练好,你的目标是在现有权重基础上,实现前馈神经网络。
若已给定神经网络中的theta矩阵(需要用反向传播算法得出),实现前馈神经网络,理解神经网络的作用。
题目已给出a(1)为第一层输入层数据,有400个神经元代表每个数字的图像(不加偏置值);
a(2)为隐藏层,有25个神经元(不加偏置值);
a(3)为输出层‘,又10个神经元,以10个(0/1)值的向量表示;
theta1为第一层到第二层的参数矩阵(25,401);
theta2为第二层到第三层的参数矩阵(10,26)。
数据集:
mat文件
https://www.heywhale.com/mw/project/5da56d46c83fb4004202c42b/dataset
python代码实现:
import numpy as np
import scipy.io as io
from sklearn.metrics import classification_report #sklearn是scikit-learn缩写,求评估率
#第一步 读取数据
data = io.loadmat('C:/Users/Administrator/Desktop/吴恩达机器学习数据集/week1/ex3data1.mat')
weight = io.loadmat('C:/Users/Administrator/Desktop/吴恩达机器学习数据集/week1/ex3weights.mat') #f反向传播求出的权重矩阵
theta1,theta2 = weight['Theta1'],weight['Theta2']
#题目中已给出theta1(25,401) theta2(10,26) 分别为隐藏层和输出层的theta
#theta矩阵的形状为(下层神经元个数,本层神经元个数+1),隐藏层仅一层,有25个神经元
#第二步 初始化数据
X = np.insert(data['X'],0,values=np.ones(data['X'].shape[0]),axis=1)#X增加一列1(5000,401)
X = np.matrix(X) #将X转化为矩阵
y = np.matrix(data['y'])
print("X,y的shape",X.shape, y.shape)
#第三步 设计sigmoid函数
def sigmoid(z):
return 1/(1 + np.exp(-z))
a1 = X
z2 = a1 * theta1.T #theta1为(25,401),X为(5000,401),z2为(5000,25)
a2 = sigmoid(z2) #a2为(5000,25)
a2 = np.insert(a2, 0, values=np.ones(a2.shape[0]), axis=1) #a2为(5000,26)
z3 = a2 * theta2.T #z3为(5000,10)
a3 = sigmoid(z3)
#第四步 打印预测
y_pre = np.argmax(a3, axis=1) + 1 #argmax函数返回每一行10个数中最大值的索引,并加1,返回最大值
print(classification_report(y, y_pre))