tensorflow2实战cifar100程序

最新推荐文章于 2022-01-20 15:03:02 发布

韩韩的博客

最新推荐文章于 2022-01-20 15:03:02 发布

阅读量1.1k

点赞数

分类专栏： tensorflow

本文链接：https://blog.csdn.net/qq_40605167/article/details/104369386

版权

tensorflow 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

本程序是搭建了13层神经网络，具体网络结构如下图。
在这里插入图片描述

import tensorflow as tf
from tensorflow.keras import layers,optimizers,datasets,Sequential
import os
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'
tf.random.set_seed(2345)

conv_layers=[ # 5 units of conv + max pooling
    #unit 1
    #padding="same"
    layers.Conv2D(64,kernel_size=[3,3],padding="same",activation=tf.nn.relu),
    layers.Conv2D(64,kernel_size=[3,3],padding="same",activation=tf.nn.relu),
    layers.MaxPool2D(pool_size=[2,2],strides=2,padding="same"),

    #unit 2
    #padding="same"
    layers.Conv2D(128,kernel_size=[3,3],padding="same",activation=tf.nn.relu),
    layers.Conv2D(128,kernel_size=[3,3],padding="same",activation=tf.nn.relu),
    layers.MaxPool2D(pool_size=[2,2],strides=2,padding="same"),

    # unit 3
    # padding="same"
    layers.Conv2D(256, kernel_size=[3, 3], padding="same", activation=tf.nn.relu),
    layers.Conv2D(256, kernel_size=[3, 3], padding="same", activation=tf.nn.relu),
    layers.MaxPool2D(pool_size=[2, 2], strides=2, padding="same"),

    # unit 4
    # padding="same"
    layers.Conv2D(512, kernel_size=[3, 3], padding="same", activation=tf.nn.relu),
    layers.Conv2D(512, kernel_size=[3, 3], padding="same", activation=tf.nn.relu),
    layers.MaxPool2D(pool_size=[2, 2], strides=2, padding="same"),

    # unit 5
    # padding="same"
    layers.Conv2D(512, kernel_size=[3, 3], padding="same", activation=tf.nn.relu),
    layers.Conv2D(512, kernel_size=[3, 3], padding="same", activation=tf.nn.relu),
    layers.MaxPool2D(pool_size=[2, 2], strides=2, padding="same")

]

def preprocess(x,y):
    x=tf.cast(x,dtype=tf.float32)/255.
    y=tf.cast(y,dtype=tf.int32)
    return x,y


(x,y),(x_test,y_test)=datasets.cifar100.load_data()
#因为y的维度是(64,1)的，需要squeeze掉。
y=tf.squeeze(y,axis=1)
y_test=tf.squeeze(y_test,axis=1)
print(x.shape,y.shape,x_test.shape,y_test.shape)

train_db=tf.data.Dataset.from_tensor_slices((x,y))
train_db=train_db.shuffle(1000).map(preprocess).batch(64)

test_db=tf.data.Dataset.from_tensor_slices((x_test,y_test))
test_db=test_db.map(preprocess).batch(64)

sample=next(iter(train_db))
print('sample',sample[0].shape,sample[1].shape,
      tf.reduce_min(sample[0]),tf.reduce_max(sample[1]))

def main():
    #[b,32,32,3] => [b,1,1,512]
    conv_net=Sequential(conv_layers)
    # x=tf.random.normal([4,32,32,3])
    # out=conv_net(x)
    # print(out.shape)
    fc_net=Sequential([
        layers.Dense(256,activation=tf.nn.relu),
        layers.Dense(128,activation=tf.nn.relu),
        layers.Dense(100,activation=None)

    ])
    conv_net.build(input_shape=[None,32,32,3])
    fc_net.build(input_shape=[None,512])
    #设置优化器，这里设置lr=1e-4,如果较大，容器gradient vanish
    optimizer=optimizers.Adam(lr=1e-4)
    #下面是将两个variables进行拼接
    #类似 [1,2] + [3,4] => [1,2,3,4]
    variables=conv_net.trainable_variables + fc_net.trainable_variables
    for epoch in range(50):
        for step,(x,y) in enumerate(train_db):
            #这里做一个前向循环,将需要求解梯度放进来
            with tf.GradientTape() as tape:
                #[b,32,32,3] => [b,1,1,512]
                out=conv_net(x)
                #squeeze/flatten => [b,512]
                out=tf.reshape(out,[-1,512])
                #送到全连接层 [b,512] => [b,100]
                logits=fc_net(out)
                #[b] => [b,100]
                y_onehot=tf.one_hot(y,depth=100)
                #compute loss
                loss=tf.losses.categorical_crossentropy(y_onehot,logits,from_logits=True)
                #计算均值
                loss=tf.reduce_mean(loss)
            #计算gradient
            grads=tape.gradient(loss,variables)
            #传给优化器两个参数：grads和variable，完成梯度更新
            optimizer.apply_gradients(zip(grads,variables))

            if step % 100 == 0:
                print(epoch,step,'losses:',float(loss))
        total_num=0
        total_correct=0
        for x,y in test_db:
            out=conv_net(x)
            out=tf.reshape(out,[-1,512])
            logits=fc_net(out)
            prob=tf.nn.softmax(logits,axis=1)
            pred=tf.argmax(prob,axis=1)
            pred=tf.cast(pred,dtype=tf.int32)
            correct=tf.cast(tf.equal(pred,y),dtype=tf.int32)
            correct=tf.reduce_sum(correct)

            total_num += x.shape[0]
            total_correct += int(correct)
        acc=total_correct / total_num
        print(epoch,'acc:',acc)
if __name__ == '__main__':
    main()