深度学习入门笔记系列 ( 八 ) ——基于 tensorflow 的手写数字的识别(进阶)

基于 tensorflow 的手写数字的识别(进阶)

本系列将分为 8 篇 。本次为第 8 篇 ,基于 tensorflow ,利用卷积神经网络 CNN 进行手写数字识别 。

1.引言

关于 mnist 数据集的介绍和卷积神经网络的笔记在本系列文章中已有过介绍 ,有需要可见下述两篇文章 。本系列第 5 篇曾实现利用最简单的 BP 神经网络进行手写数字识别 。本系列第 6 篇简单介绍了下卷积神经网络的知识 。

基于 tensorflow 的手写数字识别

卷积神经网络(CNN)学习笔记

2.设计的 CNN 结构

本系列第 4 讲讲过实战可以大致分为 "三步走"

 ●   定义神经网络的结构和前向传播的输出结果
 ●   定义损失函数以及选择反向传播优化的算法
 ●   生成会话(tf.Session) 并在训练数据上反复运行反向传播优化算法

这里也一样 ,当然首先是设计我们针对此实战的卷积神经网络 ,设计一个最简单的如下手绘 (还是那句话 ,字丑人帅 ,拒绝反驳)

7ab29816819a05aa115819c4d46ad607ebf46209

上图得到两次卷积池化结果后 ,将结果展平为 1 维向量 ,即1 *(7*7*64),再连接到十个节点的输出层 。

3.手动干起来 !

首先 ,需要读取 MNIST 数据集 ,利用 TF 框架自带类进行下载读取 。

bb779062cc90298ebfc533c42f4ee37a9fbb4376

接下来就是根据之前的 “三步走” 进行实践 。实现上述的网络结构 ,并依旧选择二次代价函数和梯度下降法 。

首先 ,定义两个函数 ,用于初始化参数 。再定义两个函数实现卷积核池化(只是便于模块化 ,提高可读性)。

d32b5a079f26d0b87fd0c23de7b68ea725b1d0bf

根据上述手绘结构图进行编程实现该结构 。

3f6372a06d14e13fcad7459925f188d22ad9d87c

这里有一个 dropout 操作 ,目的是训练过程中使一部分神经元参数不变 ,即不参与训练 ,相当于简化结构 ,减少过拟合 。

31a868d9635903f2f571ed9483d56ed7829a018a

再在会话 Session 中执行 ,并保存好模型参数 。

3f2ad2a2e01c64e68f250acabd297e1a99d6a001

测试结果(小詹在按时付费的某服务器跑的结果)如下图 :

b9736109d4bc835ba262e8405482334a93075cda


原文发布时间为:2018-09-14
本文作者:小詹本文来自云栖社区合作伙伴“ 小詹学Python”,了解相关信息可以关注“ 小詹学Python”。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值