分类任务5——AlexNet模型

本文介绍了在实现分类任务时使用AlexNet模型遇到的问题,重点讨论了Batch Normalization的重要性。作者分享了未使用和使用Batch Normalization的代码版本,通过对比说明了Batch Normalization对模型训练精度的提升,并提供了相关教程链接。
摘要由CSDN通过智能技术生成

我tm吹爆batch_norm!!!!!一开始以为换了tfrecord之后也可以和以前直接读取图片那样不需要batch_norm,但是几天的训练精度都在0.2,我不禁怀疑起了人生,最后用了batch_norm,一切都回来了。现在我把两个版本的代码都放上来,留作纪念,并希望可以帮助到需要的人。

附上个batch_norm的教程链接。Batch Normalization – Solutions

在定义网络层的时候,如果要通过tf.get_variable()来用进行参数的xavier初始化tf.contrib.layers.xavier_initializer(),那么在前面应该使用tf.variable_scope而不是tf.name_scope()。这是因为name_scopeget_variable之间会存在参数复用的问题,会报错。

没有batch_norm的代码如下:

"""

# AlexNet模型

"""
import tensorflow as tf


'''
获取tensor信息
'''
def print_tensor_info(tensor):
    print("tensor name:",tensor.op.name,"-tensor shape:",tensor.get_shape().as_list())


def inference(input, num_class, keep_prob):

    # 定义参数
    parameters = []

    # 第一层卷积层
    with tf.variable_scope("conv1"):
        # 设置卷积核5×5,3通道,32个卷积核
        # kernel1 = tf.Variable(tf.truncated_normal([5,5,3,32],mean=0,stddev=0.1,
        #                                           dtype=tf.float32),name="weights")
        kernel1 = tf.get_variable("weight", [5, 5, 3, 32],
                                  initializer=tf.contrib.layers.xavier_initializer())
        # 卷积,卷积的横向步长和竖向补偿都为4
        conv = tf.nn.conv2d(input,kernel1,[1,1,1,1],padding="SAME")
        #初始化偏置
        biases = tf.get_variable("bias", [32], initializer=tf.contrib.layers.xavier_initializer())
        bias = tf.nn.bias_add(conv,biases)
        #RELU激活函数
        conv1 = tf.nn.relu(bias)
        #输出该层的信息
        print_tensor_info(conv1)
        #统计参数
        parameters += [kernel1,biases]
        #lrn处理
        #lrn1 = tf.nn.lrn(conv1,4,bias=1,alpha=1e-3/9,beta=0.75,name="lrn1")
        #最大池化
        pool1 = tf.nn.max_pool(conv1,ksize=[1,2,2,1],strides=[1,2,2,1],padding="SAME",name="pool1")
        print_tensor_info(pool1)

    # 可视化输出
    with tf.variable_scope('visual'):
        x_min = tf.reduce_min(kernel1)
        x_max = tf.reduce_max(kernel1)
        kernel_0_to_1 = (kernel1 - x_min) / (x_max - x_min)
        # to tf.image_summary format [batch_size, height, width, channels]
        kernel_transposed = tf.transpose(kernel_0_to_1, [3, 0, 1, 2])
        # this will display random 3 filters from the 64 in conv1
        tf.summary.image('conv1/filters', kernel_transposed, max_outputs=3)
        layer1_image1 = conv1[0:1, :, :, 0:16]
        layer1_image1 = tf.transpose(layer1_image1, perm=[3, 1, 2, 0])
        tf.summary.image("filtered_images_layer1", layer1_image1, max_outputs=16)



    #第二层卷积层
    with tf.<
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值