深度学习（二）——案例，两层DNN进行图片识别

最新推荐文章于 2024-03-21 13:41:25 发布

qq_41386300

最新推荐文章于 2024-03-21 13:41:25 发布

阅读量1k

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_41386300/article/details/100607953

版权

深度学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

只有一层隐藏层，一般叫多层感知机
深度神经网络（DNN）
除了输出层，每层都包括bias，都是全连接到下一层
人工神经网络（ANN）有两个或两个以上隐藏层

在这里插入图片描述
每根线上都有w

代码：

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data
import numpy as np
# 全连接，通过它进行上下层之间的全连接
from tensorflow.contrib.layers import fully_connected


# 构建图阶段
n_inputs = 28*28  # 输入层结点数，784像素
n_hidden1 = 300  # 第一个隐藏层结点数
n_hidden2 = 100  # 第二个隐藏层结点数
n_outputs = 10  # 输出层十个，因为有十个数字的图片啊

X = tf.placeholder(tf.float32, shape=(None, n_inputs), name='X')
y = tf.placeholder(tf.int64, shape=(None), name='y')


# 构建神经网络层，我们这里两个隐藏层，基本一样，除了输入inputs到每个神经元的连接不同
# 和神经元个数不同
# 输出层也非常相似，只是激活函数从ReLU变成了Softmax而已
# activation=None 就是没有激活
def neuron_layer(X, n_neurons, name, activation=None):
    # 包含所有计算节点对于这一层，name_scope可写可不写
    with tf.name_scope(name):
        # 取输入矩阵的维度作为层的输入连接个数
        n_inputs = int(X.get_shape()[1])
        stddev = 2 / np.sqrt(n_inputs)  # 标准方差
        # 这层里面的w可以看成是二维数组，每个神经元对于一组w参数
        # truncated normal distribution 比 regular normal distribution的值小
        # 不会出现任何大的权重值，确保慢慢的稳健的训练
        # 使用这种标准方差会让收敛快
        # w参数需要随机，不能为0，否则输出为0，最后调整都是一个幅度没意义
        # w的初始化，服从正态分布，正态分布的宽度取决于上面算得的方差的大小
        init = tf.truncated_normal((n_inputs, n_neurons), stddev=stddev)
        w = tf.Variable(init, name='weights')
        b = tf.Variable(tf.zeros([n_neurons]), name='biases')
        # 向量表达的使用比一条一条加和要高效
        z = tf.matmul(X, w) + b
        if activation == "relu":
            return tf.nn.relu(z)
        else:
            return z


with tf.name_scope("dnn"):
    hidden1 = neuron_layer(X, n_hidden1, "hidden1", activation="relu")
    hidden2 = neuron_layer(hidden1, n_hidden2, "hidden2", activation="relu")
    # 进入到softmax之前的结果
    logits = neuron_layer(hidden2, n_outputs, "outputs")

# 用下面这4行可以代替上面22～49行全部
# with tf.name_scope("dnn"):
#     # tensorflow使用这个函数帮助我们使用合适的初始化w和b的策略，默认使用ReLU激活函数
#     hidden1 = fully_connected(X, n_hidden1, scope="hidden1")
#     hidden2 = fully_connected(hidden1, n_hidden2, scope="hidden2")
#     logits = fully_connected(hidden2, n_outputs, scope="outputs", activation_fn=None)

with tf.name_scope("loss"):
    # 定义交叉熵损失函数，并且求个样本平均
    # 函数等价于先使用softmax损失函数，再接着计算交叉熵，并且更有效率
    # 类似的softmax_cross_entropy_with_logits只会给one-hot编码，我们使用的会给0-9分类号
    xentropy = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y, logits=logits)
    loss = tf.reduce_mean(xentropy, name="loss")

learning_rate = 0.01

with tf.name_scope("train"):
    # 梯度下降的优化器
    optimizer = tf.train.GradientDescentOptimizer(learning_rate)
    training_op = optimizer.minimize(loss)

with tf.name_scope("eval"):
    # 获取logits里面最大的那1位和y比较类别好是否相同，返回True或者False一组值
    correct = tf.nn.in_top_k(logits, y, 1)
    accuracy = tf.reduce_mean(tf.cast(correct, tf.float32))

init = tf.global_variables_initializer()
saver = tf.train.Saver()

# 计算图阶段
mnist = input_data.read_data_sets("MNIST_data_bak/")
n_epochs = 400
batch_size = 50

with tf.Session() as sess:
    init.run()
    for epoch in range(n_epochs):
        for iteration in range(mnist.train.num_examples // batch_size):
            X_batch, y_batch = mnist.train.next_batch(batch_size)
            sess.run(training_op, feed_dict={X: X_batch, y: y_batch})
        acc_train = accuracy.eval(feed_dict={X: X_batch, y: y_batch})
        acc_test = accuracy.eval(feed_dict={X: mnist.test.images,
                                            y: mnist.test.labels})
        print(epoch, "Train accuracy:", acc_train, "Test accuracy:", acc_test)

    save_path = saver.save(sess, "./my_dnn_model_final.ckpt")


# 使用模型预测
# with tf.Session as sess:
#     saver.restore(sess, "./my_dnn_model_final.ckpt")
#     X_new_scaled = [...]
#     Z = logits.eval(feed_dict={X: X_new_scaled})
#     y_pred = np.argmax(Z, axis=1)  # 查看最大的类别是哪个

qq_41386300

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
深度学习（二）——案例，两层DNN进行图片识别

只有一层隐藏层，一般叫多层感知机深度神经网络DNN每根线上都有wimport tensorflow as tffrom tensorflow.examples.tutorials.mnist import input_dataimport numpy as np# 全连接，通过它进行上下层之间的全连接from tensorflow.contrib.layers import fu...
复制链接

扫一扫