python实现神经网络识别手写字

最新推荐文章于 2024-04-04 09:56:17 发布

瑾明达2号

最新推荐文章于 2024-04-04 09:56:17 发布

阅读量366

点赞数 1

文章标签：神经网络 python 深度学习

本文链接：https://blog.csdn.net/weixin_43087913/article/details/109201694

版权

csv文件下载
https://pjreddie.com/projects/mnist-in-csv/
迅雷下载快

参考书籍：《python 神经网络编程》Tariq Rashid 著林赐译
看两遍就理解神经网络中各种算法了，这隐藏层只有一层，激活函数使用的sigmod, 可以使用别的

看吴恩达讲的神经网络部分没有看很懂，看这个就很理解了，书中对过程讲解非常透彻

可以改变学习率、隐藏层节点个数，世代数（迭代数），激活函数，寻找好的网络，多次试验，避免在梯度下降过程中随机性的影响，迭代次数过多会使模型过拟合，学习率过低也是有害的，限制了梯度下降的速度，使用的步长太小了，对性能造成了损害，也是有道理的。

学习率0.2 世代数为5 - 7，隐藏层节点个数为500 神经网路模型会取得很好的表现

神经网络常见的激活函数汇总

import numpy as np
import scipy.special
import matplotlib.pyplot as plt
import pylab


# 定义神经网络类
class neuralNetwork:
    # 初始化神经网络
    def __init__(self, inputnodes, hiddennodes, outputnodes, learningrate):
        # 设定输入层，隐藏层，输出层的节点个数
        self.inodes = inputnodes
        self.hnodes = hiddennodes
        self.onodes = outputnodes

        # 设置学习率
        self.lr = learningrate

        # 创建链接权重矩阵 whi,who，即隐藏层输入权重矩阵，隐藏层输出权重矩阵
        # self.wih = (np.random.rand(self.hnodes, self.inodes) - 0.5)     # (-0.5, 0.5)
        # self.wio = (np.random.rand(self.inodes, self.onodes) - 0.5)     # (-0.5, 0.5)
        # 使用正态分布采样权重，其中平均值为0，标准方差为节点传入链接数目的开方
        self.wih = np.random.normal(0.0, pow(self.hnodes, -0.5), (self.hnodes, self.inodes))
        self.who = np.random.normal(0.0, pow(self.onodes, -0.5), (self.onodes, self.hnodes))

        # 定义激活函数 sigmod(x)
        self.activation_function = lambda x: scipy.special.expit(x)

    # 训练神经网络
    def train(self, input_list, target_list):
        # 将输入列表转化成二维数组
        inputs = np.array(input_list, ndmin=2).T
        targets = np.array(target_list, ndmin=2).T

        # 计算隐藏层输入
        hidden_inputs = np.dot(self.wih, inputs)

        # 计算隐藏层输出
        hidden_outputs = self.activation_function(hidden_inputs)

        # 计算输出层输入
        final_inputs = np.dot(self.who, hidden_outputs)

        # 计算输出层输出
        final_outputs = self.activation_function(final_inputs)

        # 误差计算 error = （target - actual）
        output_errors = targets - final_outputs

        # 计算隐藏层误差
        hidden_errors = np.dot(self.who.T, output_errors)

        # 更新隐藏层和输出层之间的权重矩阵
        self.who += self.lr * np.dot((output_errors * final_outputs *
                                      (1.0 - final_outputs)), np.transpose(hidden_outputs))

        # 更新输入层和隐藏层之间的权重矩阵
        self.wih += self.lr * np.dot((hidden_errors * hidden_outputs *
                                      (1.0 - hidden_outputs)), np.transpose(inputs))
        pass

    # 测试，查询
    def query(self, inputs):
        # 计算隐藏层输入
        hidden_inputs = np.dot(self.wih, inputs)

        # 计算隐藏层输出（经过激活函数）
        hidden_outputs = self.activation_function(hidden_inputs)

        # 计算输出层的输入
        final_inputs = np.dot(self.who, hidden_outputs)

        # 计算输出层的输出（经过激活函数）
        final_outputs = self.activation_function(final_inputs)
        return final_outputs


# 参数
input_nodes = 784
hidden_nodes = 100
output_nodes = 10

learning_rate = 0.1

# 创建神经网络实例
n = neuralNetwork(input_nodes, hidden_nodes, output_nodes, learning_rate)

# 加载训练数据文件
training_data_file = open("mnist_train.csv", 'r')
training_data_file_list = training_data_file.readlines()
training_data_file.close()

# 训练神经网络
for record in training_data_file_list:
    # 分离出数据为一个列表/向量
    all_values = record.split(',')

    # 输入数据预处理
    inputs = (np.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01

    # 取出样本标签, 初始化为全0.01，设置目标标签为0.99
    targets = np.zeros(output_nodes) + 0.01
    targets[int(all_values[0])] = 0.99
    n.train(inputs, targets)
    pass

# 加载测试文件
test_data_file = open("mnist_test.csv", 'r')
test_data_file_list = test_data_file.readlines()
test_data_file.close()

scorecard = []

# 测试神经网络
for record in test_data_file_list:
    # 分离数据为一个列表/向量
    all_values = record.split(',')

    # 去除正确的标签
    correct_label = int(all_values[0])
    inputs = (np.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01

    # 向神经网络查询标签
    outputs = n.query(inputs)

    # 取出数值最高的标签
    label = np.argmax(outputs)

    if label == correct_label:
        scorecard.append(1)
    else:
        scorecard.append(0)
    pass

scorecard_array = np.asanyarray(scorecard)
print("performance = ", scorecard_array.sum() / scorecard_array.size)