深度学习编程笔记：kears基础：手写数字识别

最新推荐文章于 2022-04-10 08:31:20 发布

还好江南

最新推荐文章于 2022-04-10 08:31:20 发布

阅读量307

点赞数

分类专栏：深度学习编程笔记文章标签：深度学习 tensorflow 神经网络机器学习 numpy

本文链接：https://blog.csdn.net/weixin_42503072/article/details/105878895

版权

本文是深度学习编程笔记，通过Keras不使用内置封装函数，而是直接用层方法构建神经网络，进行手写数字识别。讨论了模型的前向传播和关键代码理解，展示了使用`compile`和`fit`替换部分训练和测试过程，并添加了评价指标。最终，通过在训练过程中设置判断条件并在达到一定精度后进行测试集评估，实现了更灵活的模型训练和验证。

摘要由CSDN通过智能技术生成

1.这里是用的层的方法写的神经网络，没有用keras里面的封装函数

baseline

代码理解点

在代码中开始前向传播的标志是modle（x），其实这是调用了python中的一个这样的东西modle.__ call__（x）,然后会自动实现call（），使x在Sequential中一层一层往下传

代码

import tensorflow as tf
from    tensorflow import keras
from    tensorflow.keras import datasets, layers, optimizers, Sequential, metrics

import  os

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'

def preprocess(x, y):

    x = tf.cast(x, dtype=tf.float32) / 255.
    y = tf.cast(y, dtype=tf.int32)
    return x,y


(x, y), (x_test, y_test) = datasets.fashion_mnist.load_data()
print(x.shape, y.shape)

batchsz = 128

db = tf.data.Dataset.from_tensor_slices((x,y))
db = db.map(preprocess).shuffle(10000).batch(batchsz)

db_test = tf.data.Dataset.from_tensor_slices((x_test,y_test))
db_test = db_test.map(preprocess).batch(batchsz)

# # 生成train数据的迭代器
db_iter = iter(db)
sample = next(db_iter)
print('batch:', sample[0].shape, sample[1].shape)


model = Sequential([
    layers.Dense(256, activation=tf.nn.relu), # [b, 784] => [b, 256]
    layers.Dense(128, activation=tf.nn.relu), # [b, 256] => [b, 128]
    layers.Dense(64, activation=tf.nn.relu), # [b, 128] => [b, 64]
    layers.Dense(32, activation=tf.nn.relu), # [b, 64] => [b, 32]
    layers.Dense(10) # [b, 32] => [b, 10], 330 = 32*10 + 10
])
model.build(input_shape=[None, 28*28])
model.summary()
# w = w - lr*grad
optimizer = optimizers.Adam(lr=1e-3)

def main():


    for epoch in range(30):

        # step=(样本总数)/batch_size
        #表示每运行一个iteration/step，更新一次参数权重，即进行一次学习，
        #每一次更新参数需要batch size个样本进行运算学习，根据运算结果调整更新一次参数。
        for step, (x