Tensorflow2.0(3):CNN,LSTM,tensorflow模型的加载和保存，使用inception-v3做图像处理

最新推荐文章于 2022-10-07 13:43:01 发布

weixin_51182518

最新推荐文章于 2022-10-07 13:43:01 发布

阅读量1.2k

点赞数

文章标签： tensorflow 深度学习图像识别

本文链接：https://blog.csdn.net/weixin_51182518/article/details/113624324

版权

这篇博客探讨了传统神经网络存在的问题，如参数过多和训练需求大，并介绍了CNN的局部感受野和权重共享特性，以解决这些问题。通过实例展示了CNN在MNIST数据集上的优势。接着，文章讨论了RNN和LSTM如何应对梯度消失，并解释了在TensorFlow中使用LSTM进行预测的过程。此外，还讲解了TensorFlow模型的保存和加载方法，以及如何下载并使用Inception-v3进行图像识别。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、传统神经网络的问题

结构复杂，权值太多，计算量太大
权值太多，需要大量样本进行训练
样本的大小最好是参数数量的5~30倍

2、CNN

局部感受野
weight sharing
经过一个卷积层计算，某一个值只由部分输入决定，解决了全连接层parameters太多的问题
不同的卷积核扫过图片可以得到不同的特征。输出不同的channel。

3、使用CNN

import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data


# In[2]:

mnist = input_data.read_data_sets('MNIST_data',one_hot=True)

#每个批次的大小
batch_size = 100
#计算一共有多少个批次
n_batch = mnist.train.num_examples // batch_size

#参数概要
def variable_summaries(var):
    with tf.name_scope('summaries'):
        mean = tf.reduce_mean(var)
        tf.summary.scalar('mean', mean)#平均值
        with tf.name_scope('stddev'):
            stddev = tf.sqrt(tf.reduce_mean(tf.square(var - mean)))
        tf.summary.scalar('stddev', stddev)#标准差
        tf.summary.scalar('max', tf.reduce_max(var))#最大值
        tf.summary.scalar('min', tf.reduce_min(var))#最小值
        tf.summary.histogram('histogram', var)#直方图

#初始化权值
def weight_variable(shape,name):
    initial = tf.truncated_normal(shape,stddev=0.1)#生成一个截断的正态分布
    return tf.Variable(initial,name=name)

#初始化偏置
def bias_variable(shape,name):
    initial = tf.constant(0.1,shape=shape)
    return tf.Variable(initial,name=name)

#卷积层
def conv2d(x,W):
    #x input tensor of shape `[batch, in_height, in_width, in_channels]`
    #W filter / kernel tensor of shape [filter_height, filter_width, in_channels, out_channels]
    #`strides[0] = strides[3] = 1`. strides[1]代表x方向的步长，strides[2]代表y方向的步长
    #padding: A `string` from: `"SAME", "VALID"`
    return tf.nn.conv2d(x,W,strides=[1,1,1,1],padding='SAME')

#池化层
def max_pool_2x2(x):
    #ksize [1,x,y,1]
    return tf.nn.max_pool(x,ksize=[1,2,2,1],strides=[1,2,2,1],padding='SAME')

#命名空间
with tf.name_scope('input'):
    #定义两个placeholder
    x = tf.placeholder(tf.float32,[None,784],name='x-input')
    y = tf.placeholder(tf.float32,[None,10],name='y-input')
    with tf.name_scope('x_image'):
        #改变x的格式转为4D的向量[batch, in_height, in_width, in_channels]`
        x_image = tf.reshape(x,[-1,28,28,1],name='x_image')


with tf.name_scope('Conv1'):
    #初始化第一个卷积层的权值和偏置
    with tf.name_scope('W_conv1'):
        W_conv1 = weight_variable([5,5,1,32],name='W_conv1')#5*5的采样窗口，32个卷积核从1个平面抽取特征
    with tf.name_scope('b_conv1'):  
        b_conv1 = bias_variable([32],name='b_conv1')#每一个卷积核一个偏置值

    #把x_image和权值向量进行卷积，再加上偏置值，然后应用于relu激活函数
    with tf.name_scope('conv2d_1'):
        conv2d_1 = conv2d(x_image,W_conv1) + b_conv1
    with tf.name_scope('relu'):
        h_conv1 = tf.nn.relu(conv2d_1)
    with tf.name_scope('h_pool1'):
        h_pool1 = max_pool_2x2(h_conv1)#进行max-pooling

with tf.name_sc

最低0.47元/天解锁文章