神经网络代码解读

最新推荐文章于 2024-05-07 21:24:28 发布
阳光下的小鱼
最新推荐文章于 2024-05-07 21:24:28 发布
阅读量1.8k
点赞数
文章标签： tensorflow
本文链接：https://blog.csdn.net/xubaoyong/article/details/89364271
版权
""" Neural Network.

A 2-Hidden Layers Fully Connected Neural Network (a.k.a Multilayer Perceptron)
implementation with TensorFlow. This example is using the MNIST database
of handwritten digits (http://yann.lecun.com/exdb/mnist/).

Links:
    [MNIST Dataset](http://yann.lecun.com/exdb/mnist/).

Author: Aymeric Damien
Project: https://github.com/aymericdamien/TensorFlow-Examples/
"""
import tensorflow.model;
from __future__ import print_function

# Import MNIST data
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("/tmp/data/", one_hot=True)

import tensorflow as tf

# Parameters
learning_rate = 0.1
num_steps = 500
batch_size = 128
display_step = 100

# Network Parameters
n_hidden_1 = 256 # 1st layer number of neurons  第一层神经元的数量
n_hidden_2 = 256 # 2nd layer number of neurons  第二层神经元的数量
num_input = 784 # MNIST data input (img shape: 28*28)
num_classes = 10 # MNIST total classes (0-9 digits)

# tf Graph input
'''
知识点：placeholder函数，在会话中，运行模型的时候通过feed_dict()函数向占位符喂入数据
'''
X = tf.placeholder("float", [None, num_input])#类型是float,维度为：行不确定，列为num_input列
Y = tf.placeholder("float", [None, num_classes])
'''
 知识点：
    tf.Variable(initializer,name),参数initializer是初始化参数，name是可自定义的变量名称
'''
'''
知识点：
tf.random_normal()函数用于从服从指定正态分布的数值中取出指定个数的值。
tf.random_normal(shape, mean=0.0, stddev=1.0, dtype=tf.float32, seed=None, name=None)
    shape: 输出张量的形状，必选
    mean: 正态分布的均值，默认为0
    stddev: 正态分布的标准差，默认为1.0
    dtype: 输出的类型，默认为tf.float32
    seed: 随机数种子，是一个整数，当设置之后，每次生成的随机数都一样
    name: 操作的名称
例如：tf.random_normal([2, 3], stddev=1, seed=1)
'''
# Store layers weight & bias存储层权重和偏差,下面创建了个字典类
weights = {
    'h1': tf.Variable(tf.random_normal([num_input, n_hidden_1])),
    'h2': tf.Variable(tf.random_normal([n_hidden_1, n_hidden_2])),
    'out': tf.Variable(tf.random_normal([n_hidden_2, num_classes]))
}
biases = {
    'b1': tf.Variable(tf.random_normal([n_hidden_1])),
    'b2': tf.Variable(tf.random_normal([n_hidden_2])),
    'out': tf.Variable(tf.random_normal([num_classes]))
}
'''
知识点： 
tf.matmul（）将矩阵a乘以矩阵b，生成a * b。
格式: tf.matmul(a, b, transpose_a=False, transpose_b=False, adjoint_a=False, adjoint_b=False, a_is_sparse=False, b_is_sparse=False, name=None) 
参数: 
a: 一个类型为 float16, float32, float64, int32, complex64, complex128 且张量秩 > 1 的张量。 
b: 一个类型跟张量a相同的张量。 
transpose_a: 如果为真, a则在进行乘法计算前进行转置。 
transpose_b: 如果为真, b则在进行乘法计算前进行转置。 
adjoint_a: 如果为真, a则在进行乘法计算前进行共轭和转置。 
adjoint_b: 如果为真, b则在进行乘法计算前进行共轭和转置。 
a_is_sparse: 如果为真, a会被处理为稀疏矩阵。 
b_is_sparse: 如果为真, b会被处理为稀疏矩阵。 
name: 操作的名字（可选参数） 
返回值： 一个跟张量a和张量b类型一样的张量且最内部矩阵是a和b中的相应矩阵的乘积。 
注意： 
（1）输入必须是矩阵（或者是张量秩 >２的张量，表示成批的矩阵），并且其在转置之后有相匹配的矩阵尺寸。 
（2）两个矩阵必须都是同样的类型，支持的类型如下：float16, float32, float64, int32, complex64, complex128。 
引发错误: 
ValueError: 如果transpose_a 和 adjoint_a, 或 transpose_b 和 adjoint_b 都被设置为真
'''
# Create model
def neural_net(x):
    # Hidden fully connected layer with 256 neurons，隐藏全连接层，使用256个神经元
    '''
    '''
    layer_1 = tf.add(tf.matmul(x, weights['h1']), biases['b1'])
    # Hidden fully connected layer with 256 neurons
    layer_2 = tf.add(tf.matmul(layer_1, weights['h2']), biases['b2'])
    # Output fully connected layer with a neuron for each class，输出全连接层，每个类有一个神经元
    out_layer = tf.matmul(layer_2, weights['out']) + biases['out']
    return out_layer

# Construct model构建模型
logits = neural_net(X)
'''
Softmax的含义：
    Softmax简单的说就是把一个N*1的向量归一化为（0，1）之间的值，由于其中采用指数运算，使得向量中数值较大的量特征更加明显。
'''
prediction = tf.nn.softmax(logits)

# Define loss and optimizer 定义损失和优化器
'''
softmax详解
https://blog.csdn.net/bitcarmanlee/article/details/82320853

softmax交叉熵
softmax_cross_entropy_with_logits方法讲解
tf.nn.softmax_cross_entropy_with_logits(_sentinel=None, labels=None, logits=None, dim=-1, name=None)
argument:
_sentinel:本质上是不用的参数，不用填
logits:计算的输出，注意是为使用softmax或sigmoid的，维度一般是[batch_size, num_classes] ，单样本是[num_classes]。数据类型（type）是float32或float64;
labels:和logits具有相同的type(float)和shape的张量(tensor)，即数据类型和张量维度都一致。
name:操作的名字，可填可不填
output:
loss，shape:[batch_size]


tf.reduce_mean 函数用于计算张量tensor沿着指定的数轴（tensor的某一维度）上的的平均值，主要用作降维或者计算tensor（图像）的平均值。
reduce_mean(input_tensor,
                axis=None,
                keep_dims=False,
                name=None,
                reduction_indices=None)
第一个参数input_tensor： 输入的待降维的tensor;
第二个参数axis： 指定的轴，如果不指定，则计算所有元素的均值;
第三个参数keep_dims：是否降维度，设置为True，输出的结果保持输入tensor的形状，设置为False，输出结果会降低维度;
第四个参数name： 操作的名称;
第五个参数 reduction_indices：在以前版本中用来指定轴，已弃用;

'''
loss_op = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits( logits=logits, labels=Y))
optimizer = tf.train.AdamOptimizer(learning_rate=learning_rate)
train_op = optimizer.minimize(loss_op)

# Evaluate model 评价模型
correct_pred = tf.equal(tf.argmax(prediction, 1), tf.argmax(Y, 1))
accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

# Initialize the variables (i.e. assign their default value) 初始化变量
init = tf.global_variables_initializer()

# Start training
with tf.Session() as sess:

    # Run the initializer
    '''
      初始化初始变量
      '''
    sess.run(init)

    for step in range(1, num_steps+1):
        '''
        使用next_batch来加载数据
       '''
        batch_x, batch_y = mnist.train.next_batch(batch_size)
        # Run optimization op (backprop)
        '''
        运行优化
        '''
        sess.run(train_op, feed_dict={X: batch_x, Y: batch_y})

        if step % display_step == 0 or step == 1:
            # Calculate batch loss and accuracy
            loss, acc = sess.run([loss_op, accuracy], feed_dict={X: batch_x,  Y: batch_y})
            # 输出
            print("Step " + str(step) + ", Minibatch Loss= " + \
                  "{:.4f}".format(loss) + ", Training Accuracy= " + \
                  "{:.3f}".format(acc))
    #优化结束
    print("Optimization Finished!")

    # Calculate accuracy for MNIST test images 计算mnist测试图像的精度
    print("Testing Accuracy:", sess.run(accuracy, feed_dict={X: mnist.test.images,Y: mnist.test.labels}))
阳光下的小鱼
关注
0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
神经网络代码解读

""" Neural Network.A 2-Hidden Layers Fully Connected Neural Network (a.k.a Multilayer Perceptron)implementation with TensorFlow. This example is using the MNIST databaseof handwritten digits (htt...
复制链接

扫一扫