基于Cifar100数据Alexnet改进（tensorflow版本）

最新推荐文章于 2024-04-16 16:22:50 发布

WilliamCHW

最新推荐文章于 2024-04-16 16:22:50 发布

阅读量490

点赞数

文章标签： tensorflow 深度学习机器学习

本文链接：https://blog.csdn.net/chwei20002005/article/details/129616671

版权

最近一直要做on device learning ，需要一些基础的例子学习，于是做了一个alexnet ，原始的alexnet虽然在cifar10上面表现不错，但是到了cifar100就不行了，所以稍微改了改代码，增加了batch norm 和 dropout ，后来发现有些过拟合，又对数据做了数据增强，最终为了能在device上面跑转成了tflite版本，具体代码如下：

import numpy as np
import tensorflow as tf

# Load the CIFAR-100 dataset
(x_train, y_train), (x_test, y_test) = tf.keras.datasets.cifar100.load_data()

# Normalize the pixel values between 0 and 1
x_train = x_train.astype('float32') / 255.0
x_test = x_test.astype('float32') / 255.0

# Convert the labels to one-hot encoding
y_train = tf.keras.utils.to_categorical(y_train, 100)
y_test = tf.keras.utils.to_categorical(y_test, 100)

# Define the AlexNet model
model = tf.keras.models.Sequential([

    tf.keras.layers.Conv2D(96, kernel_size=3, activation='relu', input_shape=(32, 32, 3)),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.MaxPooling2D(pool_size=2),
    tf.keras.layers.Dropout(0.25),

    tf.keras.layers.Conv2D(256, kernel_size=3, activation='relu'),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.MaxPooling2D(pool_size=2),
    tf.keras.layers.Dropout(0.25),

    tf.keras.layers.Conv2D(384, kernel_size=3, activation='relu'),
    tf.keras.layers.BatchNormalization(),

    tf.keras.layers.Conv2D(256, kernel_size=3, activation='relu'),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.MaxPooling2D(pool_size=2),
    tf.keras.layers.Dropout(0.25),

    tf.keras.layers.Flatten(),
    tf.keras.layers.Dense(4096, activation='relu'),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(4096, activation='relu'),
    tf.keras.layers.BatchNormalization(),
    tf.keras.layers.Dropout(0.5),
    tf.keras.layers.Dense(100, activation='softmax')
])

# Define the optimizer and compile the model
optimizer = tf.keras.optimizers.Adam(0.0001)  # learning_rate=0.01, momentum=0.9
model.compile(optimizer=optimizer, loss='categorical_crossentropy', metrics=['accuracy'])

datagen = tf.keras.preprocessing.image.ImageDataGenerator(
    rotation_range=20,
    width_shift_range=0.2,
    height_shift_range=0.2,
    horizontal_flip=True
)
datagen.fit(x_train)

# Train the model
history = model.fit(datagen.flow(x_train, y_train, batch_size=256), epochs=100, validation_data=(x_test, y_test))

# Evaluate the model on the test set
test_loss, test_acc = model.evaluate(x_test, y_test)

print(f'Test loss: {test_loss:.4f}')
print(f'Test accuracy: {test_acc:.4f}')

converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()

with open('new_alexnet.tflite', 'wb') as f:
    f.write(tflite_model)