构建简单网络和优化方法—手写数字识别

构建简单网络和优化方法—手写数字识别

1,如何构建初始的“手写数字识别”神经网络?

​ 1.下载MNIST_data集并把该数据集放在源.py/.ipynb文件的相同路径位置,并载入数据集。

在这里插入图片描述

​ 2.自定义batch_size(每个批次读取图片的数量大小),并计算n_batch(总共的批次数)。

​ 3.定义x和y,使用feed方法进行数据输入。

​ 4.创建一个简单的神经网络,输入层为784个神经元,输出层为10个神将元。(需要注意的是:激活函数使用softmax(),用于将计算结果进行概率转换。)

​ 5.损失函数使用二次代价函数,loss = tf.reduce_mean(tf.square(y-prediction))。

​ 6.优化器使用梯度下降法,train_step = tf.train.GradientDescentOptimizer(xx).minimize(loss)。

​ 7.结果存放在一个布尔型列表中,correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))#argmax返回一维张量中最大的值所在的位置。

​ 8.定义准确率,accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))。

​ 9使用默认图tensorflow.Session()进行训练并调用测试。(需要注意的地方:sess.run(train_step)使用的是train集,而sess.run(accuracy)使用的是test集。)

在这里插入图片描述

2,如何进行简单网络的优化?

1.对w,b的初始值进行优化。

W = tf.Variable(tf.truncated_normal([784, 3000], stddev=0.1))
b = tf.Variable(tf.zeros([3000])+0.1)

2.使用交叉熵函数作为损失函数。

#交叉熵函数
loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=y, logits=prediction))

需要注意的是:

​ 在Tensorflow中用: tf.nn.softmax_cross_entropy_with_logits()来表示跟softmax搭配使用的交叉熵。

3.添加多个中间层,同时使用Dropout()防止过拟合发生。

#创建神经网络的中间层1
W1 = tf.Variable(tf.truncated_normal([784, 500], stddev=0.1))
b1 = tf.Variable(tf.zeros([500])+0.1)
predict1 = tf.nn.tanh(tf.matmul(x, W1)+b1)
drop_1 = tf.nn.dropout(predict1, keep_prob)
#创建神经网络的中间层2
W2 = tf.Variable(tf.truncated_normal([500, 300], stddev=0.1))
b2 = tf.Variable(tf.zeros([300])+0.1)
predict2 = tf.nn.tanh(tf.matmul(drop_1, W2)+b2)
drop_2 = tf.nn.dropout(predict2, keep_prob)
#创建神经网络的输出层
W3 = tf.Variable(tf.truncated_normal([300, 10], stddev=0.1))
b3 = tf.Variable(tf.zeros([10])+0.1)
prediction = tf.nn.softmax(tf.matmul(drop_2, W3)+b3)

注:keep_prob为随机抽取同一层神经元的比例,神经元个数控制在数据集相近

4.使用优化器AdamOptimizer,减小学习率的变化速度

#定义变量学习率lr,初始化为0.001
lr = tf.Variable(0.001, dtype=tf.float32)
#使用AdamOptimizer优化器
train_step = tf.train.AdamOptimizer(lr).minimize(loss)
#在迭代中设置学习率变化幅度
sess.run(tf.assign(lr, 0.001*(0.95**epoch)))

本题采用以上4种优化方法后优化效果较好。

优化后的测试结果:
在这里插入图片描述
附:优化前的简单网络的构建代码—手写字体识别:


#载入数据集
mnist = input_data.read_data_sets("MNIST_data",one_hot=True)

#每个批次的大小
batch_size = 100
#计算一共有多少个批次
n_batch = mnist.train.num_examples // batch_size

#定义两个placeholder
x = tf.placeholder(tf.float32,[None,784])
y = tf.placeholder(tf.float32,[None,10])

#创建一个简单的神经网络
W = tf.Variable(tf.zeros([784,10]))
b = tf.Variable(tf.zeros([10]))
prediction = tf.nn.softmax(tf.matmul(x,W)+b)

#二次代价函数
loss = tf.reduce_mean(tf.square(y-prediction))
#使用梯度下降法
train_step = tf.train.GradientDescentOptimizer(0.2).minimize(loss)

#初始化变量
init = tf.global_variables_initializer()

#结果存放在一个布尔型列表中
correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))#argmax返回一维张量中最大的值所在的位置
#求准确率
accuracy = tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

with tf.Session() as sess:
    sess.run(init)
    for epoch in range(21):
        for batch in range(n_batch):
            batch_xs,batch_ys =  mnist.train.next_batch(batch_size)
            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})
        
        acc = sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})
        print("Iter " + str(epoch) + ",Testing Accuracy " + str(acc))

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
使用PaddlePaddle框架构建卷积神经网络进行手写数字识别是一个简单而有效的方法。在构建模型之前,首先需要导入所需的工具包和数据集。 使用PaddlePaddle,可以方便地导入MNIST数据集,该数据集包含手写数字的图像和相应的标签。可以使用`paddle.vision.datasets.MNIST`函数加载训练和测试数据集。加载完成后,还可以对数据进行预处理,例如归一化和转换为合适的格式。 在构建卷积神经网络模型之前,需要定义模型的结构。可以使用`paddle.nn.Sequential`来快速构建一个连续的神经网络模型。可以添加一些卷积层、池化层、全连接层和激活函数等。对于手写数字识别任务,可以选择一些经典的网络结构,例如LeNet和AlexNet,或者自定义一些更复杂的架构。 当模型结构定义好后,可以通过`paddle.Model`来封装模型,并进行模型的配置和训练。可以设置损失函数、优化器和评估指标等。对于手写数字识别任务,可以选择交叉熵损失函数和梯度下降优化器。还可以定义一些评估指标,例如准确率。 进行模型训练前,需要设置一些超参数,如学习率、批大小和训练轮数等。可以选择合适的超参数进行训练,并使用训练数据进行模型参数的更新。训练过程中,可以使用交叉验证方法模型进行调优,以提高模型的性能。 训练完成后,可以使用测试数据对模型进行评估。通过计算模型在测试数据上的准确率等指标,可以评估模型的性能。如果模型性能不满足要求,可以通过调整模型结构、超参数和训练方法等来改进模型。 总的来说,使用PaddlePaddle框架构建卷积神经网络进行手写数字识别是一种简单且可行的方法。通过合适的数据预处理、模型构建、训练和评估等步骤,可以得到高性能的手写数字识别模型
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Super__Tiger

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值