【深度学习之路2】AlexNet

最新推荐文章于 2022-06-10 21:22:32 发布

TheonlyRain

最新推荐文章于 2022-06-10 21:22:32 发布

阅读量225

点赞数

分类专栏：学习文章标签：神经网络深度学习人工智能

本文链接：https://blog.csdn.net/King_why_love/article/details/115318496

版权

学习专栏收录该内容

6 篇文章 3 订阅

订阅专栏

文章目录

第02篇 AlexNet01
第02篇 AlexNet02
第02篇 AlexNet03
- 环境要求
- 代码部分

部分内容来源于深度之眼

第02篇 AlexNet01

基于卷积神经网络的图像分类

《ImageNet Classification with Deep Convolutional Neural Network》

1、论文研究背景、成果及意义

在这里插入图片描述

Top-1表示检测为一个小类，Top-5表示检测为一个大类

在这里插入图片描述

图像分类研究的意义
在这里插入图片描述

图像分类问题简介(CNN)

在这里插入图片描述

图像分类的发展历史

在这里插入图片描述

2、未来技术研究趋势

基于神经网络的图像分类

在这里插入图片描述

3、前期知识储备

在这里插入图片描述

4、课程安排和学习建议

在这里插入图片描述

第02篇 AlexNet02

在这里插入图片描述

1、论文整体框架

在这里插入图片描述

摘要

在这里插入图片描述

优点

在这里插入图片描述

全连接层做Dropout

在这里插入图片描述

2、神经网络处理图像分类问题流程

在这里插入图片描述

3、网络结构及部分参数计算

在这里插入图片描述
有个细节，计算feature map size时我们发现，(224-11)/4 并不能整除，也就是说kernel在水平移动时的最后一个感受野并非为11*11。不过这个细节在后面中已经修改了，里面的输入被resize到227*227*3。

神经网络结构在线可视化工具NetScope：http://ethereon.github.io/netscope/#/gist/e65799e70358c6782b1b
在这里插入图片描述

4、网络超参数及训练

在这里插入图片描述

5、网络特点

在这里插入图片描述

第02篇 AlexNet03

在这里插入图片描述

环境要求

在这里插入图片描述

代码部分

#coding:utf-8


from __future__ import division, print_function, absolute_import

import tflearn
from tflearn.layers.core import input_data, dropout, fully_connected
from tflearn.layers.conv import conv_2d, max_pool_2d
from tflearn.layers.normalization import local_response_normalization
from tflearn.layers.estimator import regression

import tflearn.datasets.oxflower17 as oxflower17
import tensorflow as tf
import sys


X, Y = oxflower17.load_data(one_hot=True, resize_pics= (227, 227))  ##

# Building 'AlexNet'
network = input_data(shape=[None, 227, 227, 3])#输入的x  [batchsize, high, width, channel]
network = conv_2d(network, 96, 11, strides=4, activation='relu', padding='valid')
#network = tf.nn.conv2d(input, filter = tf.Variable(shape = [11, 11, 3, 96]), strides = [1, 4, 4, 1], padding = 'VALID')
#tf.nn.conv2d(input, filter = tf.Variable(shape = [3, 3, 3, 6]), strides, padding, use_cudnn_on_gpu, data_format, dilations, name)
network = max_pool_2d(network, 3, strides=2)
network = local_response_normalization(network)
network = conv_2d(network, 256, 5, activation='relu')
network = max_pool_2d(network, 3, strides=2)
network = local_response_normalization(network)
network = conv_2d(network, 384, 3, activation='relu')
network = conv_2d(network, 384, 3, activation='relu')
network = conv_2d(network, 256, 3, activation='relu')
network = max_pool_2d(network, 3, strides=2)
network = local_response_normalization(network)
network = fully_connected(network, 4096, activation='tanh')
network = dropout(network, 0.5)
network = fully_connected(network, 4096, activation='tanh')
network = dropout(network, 0.5)
network = fully_connected(network, 17, activation='softmax')
network = regression(network, optimizer='adam',#momentum
                     loss='categorical_crossentropy',
                     learning_rate=0.001)

# Training
model = tflearn.DNN(network, checkpoint_path='model_alexnet',
                    max_checkpoints=1, tensorboard_verbose=2)
model.fit(X, Y, n_epoch=1, validation_set=0.1, shuffle=True,
          show_metric=True, batch_size=64, snapshot_step=200,
          snapshot_epoch=False, run_id='alexnet_oxflowers17')
#model.predict(X)

AlexNet在MNIST手写数据集中的应用
因为图片较小，网络参数进行了一定的缩小

# coding=utf-8
import tensorflow as tf
from tensorflow.examples.tutorials.mnist import input_data

STEPS = 1500
batch_size = 64

mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

parameters = {
    'w1': tf.Variable(tf.truncated_normal([3, 3, 1, 64], dtype=tf.float32, stddev=1e-1), name='w1'),
    'w2': tf.Variable(tf.truncated_normal([3, 3, 64, 64], dtype=tf.float32, stddev=1e-1), name='w2'),
    'w3': tf.Variable(tf.truncated_normal([3, 3, 64, 128], dtype=tf.float32, stddev=1e-1), name='w3'),
    'w4': tf.Variable(tf.truncated_normal([3, 3, 128, 128], dtype=tf.float32, stddev=1e-1), name='w4'),
    'w5': tf.Variable(tf.truncated_normal([3, 3, 128, 256], dtype=tf.float32, stddev=1e-1), name='w5'),
    'fc1': tf.Variable(tf.truncated_normal([256 * 28 * 28, 1024], dtype=tf.float32, stddev=1e-2), name='fc1'),
    'fc2': tf.Variable(tf.truncated_normal([1024, 1024], dtype=tf.float32, stddev=1e-2), name='fc2'),
    'softmax': tf.Variable(tf.truncated_normal([1024, 10], dtype=tf.float32, stddev=1e-2), name='fc3'),
    'bw1': tf.Variable(tf.random_normal([64])),
    'bw2': tf.Variable(tf.random_normal([64])),
    'bw3': tf.Variable(tf.random_normal([128])),
    'bw4': tf.Variable(tf.random_normal([128])),
    'bw5': tf.Variable(tf.random_normal([256])),
    'bc1': tf.Variable(tf.random_normal([1024])),
    'bc2': tf.Variable(tf.random_normal([1024])),
    'bs': tf.Variable(tf.random_normal([10]))
}


def conv2d(_x, _w, _b):
    '''
         封装的生成卷积层的函数
         因为NNIST的图片较小,这里采用1,1的步长
    :param _x:  输入
    :param _w:  卷积核
    :param _b:  bias
    :return:    卷积操作
    '''
    return tf.nn.relu(tf.nn.bias_add(tf.nn.conv2d(_x, _w, [1, 1, 1, 1], padding='SAME'), _b))


def lrn(_x):
    '''
    作局部响应归一化处理
    :param _x:
    :return:
    '''
    return tf.nn.lrn(_x, depth_radius=4, bias=1.0, alpha=0.001 / 9.0, beta=0.75)


def max_pool(_x, f):
    '''
        最大池化处理,因为输入图片尺寸较小,这里取步长固定为1,1,1,1
    :param _x:
    :param f:
    :return:
    '''
    return tf.nn.max_pool(_x, [1, f, f, 1], [1, 1, 1, 1], padding='SAME')


def inference(_parameters, _dropout):
    '''
     定义网络结构和训练过程
    :param _parameters:  网络结构参数
    :param _dropout:     dropout层的keep_prob
    :return:
    '''

    # 搭建Alex模型
    x = tf.placeholder(tf.float32, [None, 784])  # 输入: MNIST数据图像为展开的向量
    x_ = tf.reshape(x, shape=[-1, 28, 28, 1])  # 将训练数据reshape成单通道图片
    y_ = tf.placeholder(tf.float32, [None, 10])  # 标签值:one-hot标签值

    # 第一卷积层
    conv1 = conv2d(x_, _parameters['w1'], _parameters['bw1'])
    lrn1 = lrn(conv1)
    pool1 = max_pool(lrn1, 2)

    # 第二卷积层
    conv2 = conv2d(pool1, _parameters['w2'], _parameters['bw2'])
    lrn2 = lrn(conv2)
    pool2 = max_pool(lrn2, 2)

    # 第三卷积层
    conv3 = conv2d(pool2, _parameters['w3'], _parameters['bw3'])

    # 第四卷积层
    conv4 = conv2d(conv3, _parameters['w4'], _parameters['bw4'])

    # 第五卷积层
    conv5 = conv2d(conv4, _parameters['w5'], _parameters['bw5'])
    pool5 = max_pool(conv5, 2)

    # FC1层
    shape = pool5.get_shape()  # 获取第五卷基层输出结构,并展开
    reshape = tf.reshape(pool5, [-1, shape[1].value * shape[2].value * shape[3].value])
    fc1 = tf.nn.relu(tf.matmul(reshape, _parameters['fc1']) + _parameters['bc1'])
    fc1_drop = tf.nn.dropout(fc1, keep_prob=_dropout)

    # FC2层
    fc2 = tf.nn.relu(tf.matmul(fc1_drop, _parameters['fc2']) + _parameters['bc2'])
    fc2_drop = tf.nn.dropout(fc2, keep_prob=_dropout)

    # softmax层
    y_conv = tf.nn.softmax(tf.matmul(fc2_drop, _parameters['softmax']) + _parameters['bs'])

    # 定义损失函数和优化器
    cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y_conv), reduction_indices=[1]))
    train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)

    # 计算准确率
    correct_pred = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
    accuracy = tf.reduce_mean(tf.cast(correct_pred, tf.float32))

    with tf.Session() as sess:
        initop = tf.global_variables_initializer()
        sess.run(initop)

        for step in range(STEPS):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

            if step % 50 == 0:
                acc = sess.run(accuracy, feed_dict={x: batch_xs, y_: batch_ys})
                loss = sess.run(cross_entropy, feed_dict={x: batch_xs, y_: batch_ys})
                print('step:%5d. --acc:%.6f. -- loss:%.6f.' % (step, acc, loss))

        print('train over!')

        # Test
        test_xs, test_ys = mnist.test.images[:512], mnist.test.labels[:512]

        print('test acc:%f' % (sess.run(accuracy, feed_dict={x: test_xs, y_: test_ys})))


if __name__ == '__main__':
    inference(parameters, 0.9)

TheonlyRain

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【深度学习之路2】AlexNet

文章目录第02篇 AlexNet011、论文研究背景、成果及意义2、未来技术研究趋势3、前期知识储备4、课程安排和学习建议第02篇 AlexNet021、论文整体框架2、神经网络处理图像分类问题流程3、网络结构及部分参数计算4、网络超参数及训练5、网络特点第02篇 AlexNet03环境要求代码部分部分内容来源于深度之眼第02篇 AlexNet01基于卷积神经网络的图像分类《ImageNet Classification with Deep Convolutional Neural Network》
复制链接

扫一扫

专栏目录