TensorFlow实现mnist数字识别——两层全连接实现

最新推荐文章于 2022-12-27 04:00:00 发布

阳光非宅男

最新推荐文章于 2022-12-27 04:00:00 发布

阅读量2.5k

点赞数 1

分类专栏：机器学习/TensorFlow 文章标签： TensorFlow mnist

本文链接：https://blog.csdn.net/yunge812/article/details/79347905

版权

本文介绍了如何用TensorFlow构建一个包含两层全连接层的神经网络，用于MNIST手写数字识别。通过定义权重初始化、网络结构、训练过程和测试过程，最终达到高精度的识别效果。在训练过程中，观察到损失值随训练步数下降，表明模型逐渐收敛。测试结果显示模型在不同训练阶段的准确率逐步提升。

摘要由CSDN通过智能技术生成

一、写"添加层"函数

1.1 明确各个节点的个数

input_node = 784 #输入层的节点数相当于图片的像素28*28

output_node = 10 #输出层的节点数相当于分类器的类别的个数

L1_node = 500 #隐藏层节点的个数

1.2 定义权重初始化函数

def get_weight_variable(shape,regularizer):
    weights = tf.get_variable("weights",shape,initializer=tf.truncated_normal_initializer(stddev = 0.1))
    if regularizer!=None:
        tf.add_to_collection('losses',regularizer(weights)) #将当前变量的正则化损失加入losses集合
    return weights

1.3 构建整个网络结构共两层

#添加两个层  输出采用relu作为激活函数  实现列去线性化  
def inference(input_tensor,regularizer):
    
    #声明第一层变量并完成前向传播的过程
    with tf.variable_scope('layer1'):
        weights = get_weight_variable([input_node,L1_node],regularizer)
        bias    = tf.get_variable("bias",[L1_node],initializer = tf.constant_initializer(0.0))
        layer1  = tf.nn.relu(tf.matmul(input_tensor,weights)+bias)
        
    #声明第二层变量并完成前向传播的过程
    with tf.variable_scope('layer2'):
        weights = get_weight_variable([L1_node    ,output_node ],regularizer)
        bias    = tf.get_variable("bias",[output_node ],initializer = tf.constant_initializer(0.0))
        layer2  = tf.nn.relu(tf.matmul(layer1,weights)+bias)
    
    return layer2

layer1中输入为1*input_node w为 input_node*L1_node 的矩阵 b为1*L1_node 输出结果为1*L1_node

layer1中输入为1*L1_node w为 L1_node*output_node的矩阵 b为1*output_node输出结果为1*output_node

二、定义训练过程

2.1 定义输入输出的placeholder<