TensorFlow搭建神经网络最佳实践样例

最新推荐文章于 2024-05-31 18:07:29 发布

marsjhao

最新推荐文章于 2024-05-31 18:07:29 发布

阅读量9.4k

点赞数 2

分类专栏： TensorFlow 文章标签： TensorFlow MNIST 神经网络

本文链接：https://blog.csdn.net/marsjhao/article/details/72831021

版权

该博客展示了如何在TensorFlow中构建一个基于MNIST数据集的两层神经网络。讨论了程序的完整样例，包括前向传播函数inference和训练函数train的定义。接着分析了程序的改进点，如参数传递、模型保存和独立的训练与测试程序。最后，提供了改进后的代码结构，包括mnist_inference.py、mnist_train.py和mnist_eval.py三个文件，以实现更高效和可维护的神经网络模型。

摘要由CSDN通过智能技术生成

一、TensorFlow完整样例

在MNIST数据集上，搭建一个简单神经网络结构，一个包含ReLU单元的非线性化处理的两层神经网络。在训练神经网络的时候，使用带指数衰减的学习率设置、使用正则化来避免过拟合、使用滑动平均模型来使得最终的模型更加健壮。

程序将计算神经网络前向传播的部分单独定义一个函数inference，训练部分定义一个train函数，再定义一个主函数main。

完整程序：

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Thu May 25 08:56:30 2017

@author: marsjhao
"""

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

INPUT_NODE = 784 # 输入节点数
OUTPUT_NODE = 10 # 输出节点数
LAYER1_NODE = 500 # 隐含层节点数
BATCH_SIZE = 100
LEARNING_RETE_BASE = 0.8 # 基学习率
LEARNING_RETE_DECAY = 0.99 # 学习率的衰减率
REGULARIZATION_RATE = 0.0001 # 正则化项的权重系数
TRAINING_STEPS = 10000 # 迭代训练次数
MOVING_AVERAGE_DECAY = 0.99 # 滑动平均的衰减系数

# 传入神经网络的权重和偏置，计算神经网络前向传播的结果
def inference(input_tensor, avg_class, weights1, biases1, weights2, biases2):
    # 判断是否传入ExponentialMovingAverage类对象
    if avg_class == None:
        layer1 = tf.nn.relu(tf.matmul(input_tensor, weights1) + biases1)
        return tf.matmul(layer1, weights2) + biases2
    else:
        layer1 = tf.nn.relu(tf.matmul(input_tensor, avg_class.average(weights1))
                                      + avg_class.average(biases1))
        return tf.matmul(layer1, avg_class.average(weights2))\
                         + avg_class.average(biases2)

# 神经网络模型的训练过程
def train(mnist):
    x = tf.placeholder(tf.float32, [None,INPUT_NODE], name='x-input')
    y_ = tf.placeholder(tf.float32, [None, OUTPUT_NODE], name='y-input')

    # 定义神经网络结构的参数
    weights1 = tf.Variable(tf.truncated_normal([INPUT_NODE, LAYER1_NODE],
                                               stddev=0.1))
    biases1  = tf.Variable(tf.constant(0.1, shape=[LAYER1_NODE]))
    weights2 = tf.Variable(tf.truncated_normal([LAYER1_NODE, OUTPUT_NODE],
                                               stddev=0.1))
    biases2  = tf.Variable(tf.constant(0.1, shape=[OUTPUT_NODE]))

    # 计算非滑动平均模型下的参数的前向传播的结果
    y = inference(x, None, weights1, biases1, weights2, biases2)
    
    global_step = tf.Variable(0, trainable=False) # 定义存储当前迭代训练轮数的变量

    # 定义ExponentialMovingAverage类对象
    variable_averages = tf.train.ExponentialMovingAverage(
                        MOVING_AVERAGE_DECAY, global_step) # 传入当前迭代轮数参数
    # 定义对所有可训练变量trainable_variables进行更新滑动平均值的操作op
    variables_average

最低0.47元/天解锁文章

marsjhao

关注

2
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
TensorFlow搭建神经网络最佳实践样例

一、TensorFlow完整样例在MNIST数据集上，搭建一个简单神经网络结构，一个包含ReLU单元的非线性化处理的两层神经网络。在训练神经网络的时候，使用带指数衰减的学习率设置、使用正则化来避免过拟合、使用滑动平均模型来使得最终的模型更加健壮。程序将计算神经网络前向传播的部分单独定义一个函数inference，训练部分定义一个train函数，再定义一个主函数main。完整...
复制链接

扫一扫

专栏目录