TensorFlow-2: 用 CNN 识别数字

最新推荐文章于 2024-05-07 07:12:42 发布

Alice熹爱学习

最新推荐文章于 2024-05-07 07:12:42 发布

阅读量9k

点赞数 2

分类专栏： TensorFlow TensorFlow 文章标签： cnn 机器学习深度学习 TensorFlow

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aliceyangxi1987/article/details/70787997

版权

本文结构：

CNN
建立模型
code

昨天只是用了简单的 softmax 做数字识别，准确率为 92%，这个太低了，今天用 CNN 来提高一下准确率。

关于 CNN，可以看这篇：

图解何为CNN

简单看一个典型的 Deep CNN 由若干组 Convolution－ReLU－Pooling 层组成。

这三层可以提取出有用的 pattern，但它们并不知道这些 pattern 是什么。
所以接着是 Fully Connected 层，它可以对数据进行分类。

在 CNN 中有几个重要的概念：
- stride
- padding
- pooling

stride，就是每跨多少步抽取信息。每一块抽取一部分信息，长宽就缩减，但是厚度增加。抽取的各个小块儿，再把它们合并起来，就变成一个压缩后的立方体。

padding，抽取的方式有两种，一种是抽取后的长和宽缩减，另一种是抽取后的长和宽和原来的一样。

pooling，就是当跨步比较大的时候，它会漏掉一些重要的信息，为了解决这样的问题，就加上一层叫pooling，事先把这些必要的信息存储起来，然后再变成压缩后的层：

即 Pooling 层是用来降维的。
经过 convolution 和 ReLU 的作用后，会有越来越复杂的形式，所以Pooling 层负责提取出最重要的 pattern，进而提高时间空间的效率。

patch，就是小方块的长宽的像素，in size 是image的厚度为1，out size是输出的厚度为32:

模型

主要就是建立 2 组 convolution－pooling 层，全连接层，加 dropout 减小过拟合，得到预测值 y_conv：

每一层建立 weight 和

最低0.47元/天解锁文章

Alice熹爱学习

关注

2
点赞
踩
8

收藏

觉得还不错? 一键收藏
3
评论
TensorFlow-2: 用 CNN 识别数字

本文结构：CNN建立模型code昨天只是用了简单的 softmax 做数字识别，准确率为 92%，这个太低了，今天用 CNN 来提高一下准确率。关于 CNN，可以看这篇：图解何为CNN简单看一个典型的 Deep CNN 由若干组 Convolution－ReLU－Pooling 层组成。这三层可以提取出有用的 pattern，但它们并不知道这些 pattern 是什么。
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。