数字手写体识别python实现(全连接神经网络)

效果展示
向网络输入测试集中‘7’并绘出该输入图,得到10个标签的概率,7对应的标签概率最高,效果很好

全连接神经网络

训练测试集

mnist训练测试集,是一个手写数字识别库,世界上最权威的,美国邮政系统开发的,手写内容是0-9的内容,手写内容采集于美国人口调查局的员工和高中生
本例程中要用到的训练测试集链接:
表格形式(CSV)的mnist训练测试集,大部分电子表格和数据分析软件兼容形式(免费)
包括mnist_test.csv、mnist_train.csv、mnist_test_10.csv、mnist_train_100.csv、mnist_train.csv、mnist_test.csv分别有60000、10000个标记样本集;mnist_test_10.csv、mnist_train_100.csv则只有10条100条记录是上面的子集,在深入研究前我们常用子集验证算法再用完整集

代码说明

1、参考了Python神经网络编程([英]Tariq Rashid著) 的部分代码
2、class neuralNetwork:包含了初始化,训练,查询3个部分。初始化要初始权重wih(输入层隐藏层连接权重,who隐藏层输出层连接权重),各层的节点个数,激活函数
3、n = neuralNetwork(input_nodes,hidden_nodes,output_nodes,learning_rate)生成一个网络,input_nodes = 784、hidden_nodes = 200、output_nodes = 10、learning_rate = 0.3为网络参数,其中784=28x28,是输入像素,10是0~9共10个标签
4、循环更新权重,训练网络
for record in training_data_list:
xxxxxxxxxxxxxxx
pass
5、print(n.query((numpy.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01))查询

import numpy
numpy.set_printoptions(suppress=True)
import scipy.special
import matplotlib.pyplot

class neuralNetwork:
    def __init__(self,inputnodes,hiddennodes,outputnodes,learningrate):
        self.inodes = inputnodes
        self.hnodes = hiddennodes
        self.onodes = outputnodes
        self.lr = learningrate
        self.wih = numpy.random.normal(0.0, pow(self.hnodes,-0.5),(self.hnodes,self.inodes))
        self.who = numpy.random.normal(0.0, pow(self.onodes,-0.5),(self.onodes,self.hnodes))
        self.activation_function = lambda x: scipy.special.expit(x)
        pass
    def train(self,inputs_list,targets_list):
        inputs = numpy.array(inputs_list, ndmin=2).T
        targets = numpy.array(targets_list, ndmin=2).T
        hidden_inputs = numpy.dot(self.wih, inputs)
        hidden_outputs = self.activation_function(hidden_inputs)
        final_inputs = numpy.dot(self.who, hidden_outputs)
        final_outputs = self.activation_function(final_inputs)
        output_errors = targets - final_outputs
        hidden_eerors = numpy.dot(self.who.T,output_errors)
        self.who += self.lr * numpy.dot((output_errors * final_outputs * (1.0 - final_outputs)),numpy.transpose(hidden_outputs))
        self.wih += self.lr * numpy.dot((hidden_eerors * hidden_outputs * (1.0 - hidden_outputs)),numpy.transpose(inputs))
        pass
    def query(self,inputs_list):
        inputs = numpy.array(inputs_list, ndmin=2).T
        hidden_inputs = numpy.dot(self.wih, inputs)
        hidden_outputs = self.activation_function(hidden_inputs)
        final_inputs = numpy.dot(self.who, hidden_outputs)
        final_outputs = self.activation_function(final_inputs)
        return final_outputs
    
input_nodes = 784
hidden_nodes = 200
output_nodes = 10
learning_rate = 0.3

n = neuralNetwork(input_nodes,hidden_nodes,output_nodes,learning_rate)
training_data_file = open("mnist/mnist_train_100.csv",'r')
training_data_list = training_data_file.readlines()
training_data_file.close()

for record in training_data_list: 
    all_values = record.split(',')
    inputs = (numpy.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01
    targets = numpy.zeros(output_nodes) +0.01
    targets[int(all_values[0])] = 0.99
    n.train(inputs,targets)
    pass

test_data_file = open("mnist/mnist_test_10.csv",'r')
test_data_list = test_data_file.readlines()
test_data_file.close()
all_values = test_data_list[0].split(',')
print(all_values[0])
image_array = numpy.asfarray(all_values[1:]).reshape((28,28))
matplotlib.pyplot.imshow(image_array,cmap='Greys',interpolation='none')
print(n.query((numpy.asfarray(all_values[1:]) / 255.0 * 0.99) + 0.01))
matplotlib.pyplot.show()
  • 1
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
手写体数字识别是一个经典的图像识别问题,可以使用循环神经网络(RNN)进行解决。在本文中,我们将使用Python和Tensorflow来实现一个RNN模型,用于识别手写数字。 首先,我们需要准备手写数字数据集。我们可以使用MNIST数据集,这是一个常用的手写数字数据集,包含了60000张训练图片和10000张测试图片。我们可以使用Tensorflow中的keras库来加载数据集。 ```python from tensorflow import keras # 加载数据集 (x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data() # 将图像数据归一化到[0, 1] x_train = x_train.astype('float32') / 255. x_test = x_test.astype('float32') / 255. # 将标签转换为one-hot编码 num_classes = 10 y_train = keras.utils.to_categorical(y_train, num_classes) y_test = keras.utils.to_categorical(y_test, num_classes) ``` 接下来,我们需要将图像数据转换为序列数据,以便输入到RNN模型中。我们可以将每个图像的行作为一个序列,每个序列中的元素是该行的像素。 ```python # 将图像数据转换为序列数据 seq_length = x_train.shape[1] # 图像的行数 input_dim = x_train.shape[2] # 每行的像素数 x_train_seq = x_train.reshape((x_train.shape[0], seq_length, input_dim)) x_test_seq = x_test.reshape((x_test.shape[0], seq_length, input_dim)) ``` 接下来,我们可以构建RNN模型。在这里,我们使用一个简单的LSTM网络,该网络将每个序列中的所有行作为输入,并将最后一个LSTM单元的输出传递给一个全连接层进行分类。 ```python from tensorflow.keras.models import Sequential from tensorflow.keras.layers import LSTM, Dense # 构建RNN模型 model = Sequential() model.add(LSTM(128, input_shape=(seq_length, input_dim))) model.add(Dense(num_classes, activation='softmax')) model.summary() ``` 我们可以使用Adam优化器和交叉熵损失函数来训练模型。 ```python # 编译模型 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) # 训练模型 model.fit(x_train_seq, y_train, epochs=10, batch_size=128, validation_data=(x_test_seq, y_test)) ``` 在训练完成后,我们可以使用测试数据集来评估模型的性能。 ```python # 在测试数据集上评估模型性能 score, acc = model.evaluate(x_test_seq, y_test, batch_size=128) print('Test score:', score) print('Test accuracy:', acc) ``` 完整的代码如下: ```python from tensorflow import keras from tensorflow.keras.models import Sequential from tensorflow.keras.layers import LSTM, Dense # 加载数据集 (x_train, y_train), (x_test, y_test) = keras.datasets.mnist.load_data() # 将图像数据归一化到[0, 1] x_train = x_train.astype('float32') / 255. x_test = x_test.astype('float32') / 255. # 将标签转换为one-hot编码 num_classes = 10 y_train = keras.utils.to_categorical(y_train, num_classes) y_test = keras.utils.to_categorical(y_test, num_classes) # 将图像数据转换为序列数据 seq_length = x_train.shape[1] # 图像的行数 input_dim = x_train.shape[2] # 每行的像素数 x_train_seq = x_train.reshape((x_train.shape[0], seq_length, input_dim)) x_test_seq = x_test.reshape((x_test.shape[0], seq_length, input_dim)) # 构建RNN模型 model = Sequential() model.add(LSTM(128, input_shape=(seq_length, input_dim))) model.add(Dense(num_classes, activation='softmax')) model.summary() # 编译模型 model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy']) # 训练模型 model.fit(x_train_seq, y_train, epochs=10, batch_size=128, validation_data=(x_test_seq, y_test)) # 在测试数据集上评估模型性能 score, acc = model.evaluate(x_test_seq, y_test, batch_size=128) print('Test score:', score) print('Test accuracy:', acc) ``` 通过运行上面的代码,我们可以得到一个简单的RNN模型,用于手写数字识别

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值