2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)

最新推荐文章于 2024-03-14 10:30:00 发布

aiAIman

最新推荐文章于 2024-03-14 10:30:00 发布

阅读量851

点赞数

分类专栏：深度学习文章标签：卷积神经网络 python 深度学习机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/coolyoung520/article/details/109015324

版权

本文详细介绍了如何使用全连接神经网络和卷积神经网络处理MNIST手写数字识别任务。全连接网络包含输入、隐藏和输出层，通过非线性激活函数增强表达能力。而卷积神经网络以其对视觉问题的优化结构，如卷积层和池化层，表现出更好的识别效果。

摘要由CSDN通过智能技术生成

2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)

目录

2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)

经典的全连接神经网络

卷积神经网络

概述

前几节我们尝试使用与房价预测相同的简单神经网络解决手写数字识别问题，但是效果并不理想。原因是手写数字识别的输入是28 × 28的像素值，输出是0-9的数字标签。而线性回归模型无法捕捉二维图像数据中蕴含的复杂信息，如图1 所示。无论是牛顿第二定律任务，还是房价预测任务，输入特征和输出预测值之间的关系均可以使用“直线”刻画（使用线性方程来表达）。但手写数字识别任务的输入像素和输出数字标签之间的关系显然不是线性的，甚至这个关系复杂到我们靠人脑难以直观理解的程度。

图1：数字识别任务的输入和输出不是线性关系

经典的全连接神经网络

经典的全连接神经网络来包含四层网络：输入层、两个隐含层和输出层，将手写数字识别任务通过全连接神经网络表示，如图3 所示。

图3：手写数字识别任务的全连接神经网络结构

输入层：将数据输入给神经网络。在该任务中，输入层的尺度为28×28的像素值。
隐含层：增加网络深度和复杂度，隐含层的节点数是可以调整的，节点数越多，神经网络表示能力越强，参数量也会增加。在该任务中，中间的两个隐含层为10×10的结构，通常隐含层会比输入层的尺寸小，以便对关键信息做抽象，激活函数使用常见的sigmoid函数。
输出层：输出网络计算结果，输出层的节点数是固定的。如果是回归问题，节点数量为需要回归的数字数量；如果是分类问题，则是分类标签的数量。在该任务中，模型的输出是回归一个数字，输出层的尺寸为1。

说明：

隐含层引入非线性激活函数sigmoid是为了增加神经网络的非线性能力。

举例来说，如果一个神经网络采用线性变换，有四个输入x1x_1x1~x4x_4x4，一个输出yyy。假设第一层的变换是z1=x1−x2z_1=x_1-x_2z1=x1−x2和z2=x3+x4z_2=x_3+x_4z2=x3+x4，第二层的变换是y=z1+z2y=z_1+z_2y=z1+z2，则将两层的变换展开后得到y=x1−x2+x3+x4y=x_1-x_2+x_3+x_4y=x1−x2+x3+x4。也就是说，无论中间累积了多少层线性变换，原始输入和最终输出之间依然是线性关系。

Sigmoid是早期神经网络模型中

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)

2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)目录2.3mnist手写数字识别之网络结构精讲(百度架构师手把手带你零基础实践深度学习原版笔记系列)概述经典的全连接神经网络卷积神经网络概述前几节我们尝试使用与房价预测相同的简单神经网络解决手写数字识别问题，但是效果并不理想。原因是手写数字识别的输入是28 × 28的像素值，输出是0-9的数字标签。而线性回归模型无法捕捉二维图像数据中蕴含的复杂信息，如图1所示。无论是牛顿第二...
复制链接

扫一扫

专栏目录

aiAIman CSDN认证博客专家 CSDN认证企业博客

码龄7年

45: 原创

7万+: 周排名

55万+: 总排名

18万+: 访问

: 等级

1267: 积分

44: 粉丝

91: 获赞

49: 评论

300: 收藏

私信

关注

热门文章

分类专栏

最新评论

真香！百度网盘超级会员等级制度，等级越高，特权越多！容量，解压，转存上限，回收站保存时间，全都有！
不瘦60斤不换名字: 18t在考虑要不要直接升30t
矩阵的点乘和叉乘--深度学习应用场景针对有矩阵基础的解惑版
bnsji: 写反了
Linux(ubuntu18.04)安装GCC-9.3.0全指导--2021年尝试成功经验
钱塘江渔夫: 2023.6.21日我按该教程执行，第一次失败。第二次成功。失败的原因是在安装编译步骤，“设置配置信息”分步骤中未执行“mkdir -p /usr/local/gcc-9.3.0”。不提前创建安装路径，后面都没用。其它步骤按教程来，没问题。关于历史评论中的各种问题，评论如下： 1. 环境变量存放位置，评论有理。教程需要指明临时操作还是永久使用区别 2.其它问题都是自己的问题，自己排查下。
矩阵的点乘和叉乘--深度学习应用场景针对有矩阵基础的解惑版
qq_32375155: 不知道是不是搬运的讲解，麻烦验证一下再发布谢谢。 1 * 运算符：当参与计算的类型都为数组时，计算方式为：对应位置相乘，当其中一个类型为矩阵时，则采用矩阵乘法。 2 dot运算符：无论参与计算的是数组还是矩阵，计算方式都为：矩阵乘法， 3 multiply()运算符：无论参与计算的是数组还是矩阵，计算方式都为：对应位置相乘。数组使用*运算符时，其计算方式为对应的位置相乘，当想使用数组进行矩阵乘法时，可以使用dot实现，而矩阵使用*运算符时，其计算方式矩阵相乘，当想使用矩阵进行对应位置相乘时，可以使用multiply实现。可见 dot运算符负责数组/矩阵的矩阵乘法，multiply负责矩阵/数组的对应位置相乘。
WIN10引用的账户当前已锁定,且可能无法登录的解决方案
weixin_48575950: 安全策略设定了等待99999分钟怎么办？

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。