卷积神经网络网络篇

最新推荐文章于 2022-03-13 16:21:50 发布

不放糖的苦咖啡

最新推荐文章于 2022-03-13 16:21:50 发布

阅读量724

点赞数 2

分类专栏： CNN 文章标签：神经网络

CNN 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

10大深度学习框架

深度学习算法有多种多样化的模型组成，这是由于神经网络在构建一个完整的端到端的模型时所提供的灵活性。

计算机视觉任务的类型

1.定义：通过创建人工模型来由人类执行的视觉任务。其本质是人类的感知与观察是一个过程，它可在人工系统中被理解和实现。

2.计算机视觉任务的主要类型：

1）物体识别/分类：在物体识别中，给出一张原始图像，你的任务就是识别出该图像属于哪个类别。

2)分类+定位：如果图像中只有一个物体，你的任务是找到该物体在图像中的位置，一个更专业的称为是定位。

3)物体检测：在物体检测中，你的任务是找到图像中多个位置的各自位置，这些物体可能属于同一类型，或者各自不同。

4)图像分割：图像分割是一个稍微复杂的任务，其目标是将每一个像素映射到正确的分类。

以上的特征如下如所示：
特征所示

高级框架

一、AleNet

首个深度学习框架，AleNet是一个简单的框架，卷积层和池化层层层叠加，最上层是全连接层，这是一个非常简单的架构。

资料查询：

1）论文：ImageNet Classification with Deep Convolutional Neural Networks

2）链接：https://papers.nips.cc/paper/4824-imagenet-classification-with-deep-convolutional-neural-networks.pdf

3)代码实现：https://gist.github.com/JBed/c2fb3ce8ed299f197eff

二、VGG Net

网络特点是：金字塔型，与图像的最近底层比较宽，而顶层很深。
网络架构： Vgg网络架构
VGG 包含池化层之后的卷积层，池化层负责使层变窄。他们在论文中提出多个此类网络，不同之处在于架构深度的变化。

VGG Net网络的优势：

适合在特定任务上进行基准测试
VGG 的预训练网络可以在互联网上进行查询，免费获得，被用到各种应用。

VGG 网络缺陷：

-从开始进行训练，过程缓慢，在性能较好的GPU上进行训练，也需要一周的时间才能完成。

资料查询：

1）论文：Very Deep Convolutional Networks for Large-Scale Image Recognition

2）链接：https://arxiv.org/abs/1409.1556

3）代码实现：https://github.com/fchollet/keras/blob/master/keras/applications/vgg16.py

三、GooleNet

GooleNer(或 Inception 网络）是谷歌研究者设计的一种架构。GoogleNet 是 ImageNet 2014 的冠军，是当时最强大的模型。深度进一步增加，共有22层，VGG Net有19层。

特点：

单层出现了多种[特征抽取器（feature extractor）]，这间接的改善了网络的性能，因为该网络在训练过程中，有多个选项可以选择，来解决该任务。他可以选择输入进行卷积，也可以直接将其池化。

最终架构包括堆叠在一起的多个 inception 模块。GoogleNet 的训练过程也有稍许不同，即最上层有自己的输出层。这一细微差别帮助模型更快地进行卷积，因为模型内存在联合训练和层本身的并行训练。

GooleNet 的优势

1）GoogleNet训练速度比VGG快。

2）预训练GooleNet 的规模比VGG小，VGG规模大于500MB，而GooleNet的大小只有96MB。

GoogleNet 本身没有短期劣势，但是该架构的进一步改变使模型性能更佳。其中一个变化是 Xception 网络，它增加了 inception 模块的发散极限（我们可以从上图中看到 GoogleNet 中有 4 个 inception 模块）。现在从理论上讲，该架构是无限的（因此又叫极限 inception！）。