深度学习之卷积神经网络CNN及tensorflow代码实现示例_简单卷积神经网络代码

这里写图片描述

若在中间只使用一层隐藏层,参数 w w 就有

784×15=11760
784×15 = 11760 多个;若输入的是 28×28 28×28 带有颜色的RGB格式的手写数字图片,输入神经元就有 28×28×3=2352 28×28×3 = 2352 个…… 。这很容易看出使用全连接神经网络处理图像中的需要训练参数过多的问题。

而在卷积神经网络(Convolutional Neural Network,CNN)中,卷积层的神经元只与前一层的部分神经元节点相连,即它的神经元间的连接是非全连接的,且同一层中某些神经元之间的连接的权重 w w 和偏移

b
b 是共享的(即相同的),这样大量地减少了需要训练参数的数量。

卷积神经网络CNN的结构一般包含这几个层:

  • 输入层:用于数据的输入
  • 卷积层:使用卷积核进行特征提取和特征映射
  • 激励层:由于卷积也是一种线性运算,因此需要增加非线性映射
  • 池化层:进行下采样,对特征图稀疏处理,减少数据运算量。
  • 全连接层:通常在CNN的尾部进行重新拟合,减少特征信息的损失
  • 输出层:用于输出结果

当然中间还可以使用一些其他的功能层:

  • 归一化层(Batch Normalization):在CNN中对特征的归一化
  • 切分层:对某些(图片)数据的进行分区域的单独学习
  • 融合层:对独立进行特征学习的分支进行融合

二、CNN的层次结构

输入层:

在CNN的输入层中,(图片)数据输入的格式 与 全连接神经网络的输入格式(一维向量)不太一样。CNN的输入层的输入格式保留了图片本身的结构。

对于黑白的 28×28 28×28 的图片,CNN的输入是一个 28×28 28×28 的的二维神经元,如下图所示:

这里写图片描述

而对于RGB格式的 28×28 28×28图片,CNN的输入则是一个 3×28×28 3×28×28 的三维神经元(RGB中的每一个颜色通道都有一个 28×28 28×28 的矩阵),如下图所示:

这里写图片描述

卷积层:

在卷积层中有几个重要的概念:

  • local receptive fields(感受视野)
  • shared weights(共享权值)

假设输入的是一个 28×28 28×28 的的二维神经元,我们定义 5×5 5×5 的 一个 local receptive fields(感受视野),即 隐藏层的神经元与输入层的 5×5 5×5个神经元相连,这个5*5的区域就称之为Local Receptive Fields,如下图所示:

这里写图片描述

可类似看作:隐藏层中的神经元 具有一个固定大小的感受视野去感受上一层的部分特征。在全连接神经网络中,隐藏层中的神经元的感受视野足够大乃至可以看到上一层的所有特征。

而在卷积神经网络中,隐藏层中的神经元的感受视野比较小,只能看到上一次的部分特征,上一层的其他特征可以通过平移感受视野来得到同一层的其他神经元,由同一层其他神经元来看:

这里写图片描述

设移动的步长为1:从左到右扫描,每次移动 1 格,扫描完之后,再向下移动一格,再次从左到右扫描。

具体过程如动图所示:

这里写图片描述

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

pics/618545628)**

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

  • 26
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
TensorFlow 2是一个用于构建和训练机器学习模型的开源库,它提供了许多功能和工具,可以方便地实现图像分类任务。 首先,我们需要安装TensorFlow 2库。可以通过以下命令在Python环境中安装TensorFlow 2: ```python !pip install tensorflow ``` 完成安装后,我们可以导入TensorFlow库并加载数据集。在图像分类任务中,通常使用的是包含图像和对应标签的数据集。可以使用TensorFlow内置的数据集加载器加载常见的图像数据集,例如MNIST、CIFAR-10等。 接下来,我们需要构建模型架构。TensorFlow提供了多种建模API,其中最常用的是Keras API。可以使用Keras提供的各种层来构建模型,如卷层、池化层、全连接层等。 在构建模型架构后,我们需要选择适当的优化算法和损失函数。优化算法用于更新模型的权重以最小化损失,损失函数用于衡量模型输出与真实标签之间的差距。TensorFlow提供了许多常见的优化算法和损失函数供选择,例如梯度下降、Adam优化器和交叉熵损失函数。 进行模型训练前,我们需要对数据进行预处理。预处理的步骤可能包括调整图像大小、归一化像素值、数据增强等。可以使用TensorFlow提供的图像处理工具来完成这些预处理步骤。 最后,我们可以使用训练集对模型进行训练,并使用验证集对模型进行评估。可以使用TensorFlow提供的训练循环API进行模型的训练和评估,如fit()和evaluate()。 通过上述步骤,我们可以在TensorFlow 2中实现图像分类任务。具体代码实现可能因数据集、模型结构和训练需求的不同而有所差异,但总体流程大致相似。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值