深度学习/CV 学习笔记（一）：手写数字识别（tensorflow1.0+2.0实现）

最新推荐文章于 2024-04-10 22:00:43 发布

-Jessicaaa

最新推荐文章于 2024-04-10 22:00:43 发布

阅读量345

点赞数 1

文章标签：深度学习人工智能计算机视觉神经网络 cnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46343121/article/details/120155656

版权

目录

1. MNIST数据集

2.使用tensorflow1.0实现

2.1 环境配置

2.2 获取数据

2.3 定义变量、模型构建函数

2.4 CNN模型构建

2.5 定义损失函数及优化器

2.6 创建输入占位符

2.7 定义准确率计算函数

2.8 开始训练

2.9 训练结果

3.使用tensorflow2.0(Keras)实现

3.1 环境配置

3.2 获取数据

3.3 构建模型

3.4 编译模型

3.5 使用Tensorboard进行可视化

3.6 训练模型

3.7 保存模型

3.8 训练结果

4. 优化记录

5. 参考资料

1. MNIST数据集

使用MNIST手写数字数据集（可以下载下来，也可以使用tensorflow直接import）

数据集介绍：

train-images-idx3-ubyte.gz：训练集图片60,000张，每张大小28x28

train-labels-idx1-ubyte.gz：训练集标签60,000个

t10k-images-idx3-ubyte.gz：测试集图片10,000张，每张大小28x28

t10k-labels-idx1-ubyte.gz：测试集标签10,000个

2.使用tensorflow1.0实现

2.1 环境配置

Windows + cuda10.0 + cudnn+ Anaconda + python3.7 + tensorflow1.15(GPU)

2.2 获取数据

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('MNIST_data', one_hot=True)

2.3 定义变量、模型构建函数

# 返回初始化权重
def weight_variable(shape):
    inital = tf.truncated_normal(shape, stddev=0.1)
    return tf.Variable(inital)

# 返回初始化偏置
def bias_variable(shape):
    inital = tf.constant(0.1, shape=shape)
    return tf.Variable(inital)

# 返回卷积层
# strides: [1, x_movement, y_movement, 1]
def conv2d(x, W):
    return tf.nn.conv2d(x, W, strides = [1,1,1,1], padding = 'SAME')

# 返回最大池化层
def max_pool_2x2(x):
    return tf.nn.max_pool(x, ksize = [1,2,2,1], strides = [1,2,2,1], padding = 'SAME')

2.4 CNN模型构建

# conv1 layer
W_conv1 = weight_variable([5,5,1,32])                       # patch: 5x5, in size: 1, out size: 32
b_conv1 = bias_variable([32])
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)    # output size: 28x28x32
h_pool1 = max_pool_2x2(h_conv1)                             # output size: 14x14x32

# conv2 layer
W_conv2 = weight_variable([5,5,1,64])                       # patch: 5x5, in size: 1, out size: 64
b_conv2 = bias_variable([64])
h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)    # output size: 14x14x64
h_pool2 = max_pool_2x2(h_conv2)                             # output size: 7x7x64

# FC1 layer
W_fc1 = weight_variable([7*7*64, 1024])
b_fc1 = bias_variable([1024])
h_pool2_flat = tf.reshape(h_pool2, [-1,7*7*64])             # [n,7,7,64] >> [n,7x7x64]
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1)
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

# FC2 layer
W_fc2 = weight_variable([1024, 10])
b_fc2 = bias_variable([10])
prediction = tf.nn.softmax(tf.matmul(h_fc1_drop, W_fc2) + b_fc2)

2.5 定义损失函数及优化器

cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction), reduction_indices=[1]))
train_step = tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
深度学习/CV 学习笔记（一）：手写数字识别（tensorflow1.0+2.0实现）

目录1. MNIST数据集2.使用tensorflow1.0实现2.1 环境配置2.2 获取数据2.3 定义变量、模型构建函数2.4 CNN模型构建2.5 定义损失函数及优化器2.6 创建输入占位符2.7 定义准确率计算函数2.8 开始训练2.9 训练结果3.使用tensorflow2.0(Keras)实现3.1环境配置3.2 获取数据3.3 构建模型3.4 编译模型3.5 使用Tensorboard进行可视化3.6 训练模型3..
复制链接

扫一扫

-Jessicaaa CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

144万+: 周排名

101万+: 总排名

345: 访问

: 等级

11: 积分

0: 粉丝

1: 获赞

0: 评论

3: 收藏

私信

关注

热门文章

深度学习/CV 学习笔记（一）：手写数字识别（tensorflow1.0+2.0实现） 344

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。