Python深度学习——神经网络剖析

最新推荐文章于 2024-06-18 09:16:39 发布

SuperWiwi

最新推荐文章于 2024-06-18 09:16:39 发布

阅读量430

点赞数

分类专栏：人工智能

本文链接：https://blog.csdn.net/qq_36622009/article/details/105867153

版权

人工智能专栏收录该内容

21 篇文章 8 订阅

订阅专栏

文章目录

1.概述

训练神经网络主要围绕以下四个方面。

层，多个层组合成网络（或模型）。
输入数据和相应的目标。
损失函数，即用于学习的反馈信号。
优化器，决定学习过程如何进行。

它们之间的关系如下图所示：

在这里插入图片描述

2.层：深度学习的基础组件

神经网络的基本数据结构是层。层是一个数据处理模块，将一个或多个输入张量转换为一个或多个输出张量。有些层是无状态的，但大多数的层是有状态的，即层的权重。权重是利用随机梯度下降学到的一个或多个张量，其中包含网络的知识。

不同的张量格式与不同的数据处理类型需要用到不同的层。

简单的向量数据保存在形状为(samples, features) 的2D 张量中，通常用密集连接层［densely connected layer，也叫全连接层（fully connected layer）或密集层（dense layer），对应于Keras 的Dense 类］来处理。
序列数据保存在形状为(samples, timesteps, features) 的3D 张量中，通常用循环层（recurrent layer，比如Keras 的LSTM 层）来处理。
图像数据保存在4D 张量中，通常用二维卷积层（Keras 的Conv2D）来处理。

你可以将层看作深度学习的乐高积木，Keras 等框架则将这种比喻具体化。在Keras 中，构建深度学习模型就是将相互兼容的多个层拼接在一起，以建立有用的数据变换流程。这里层兼容性（layer compatibility）具体指的是每一层只接受特定形状的输入张量，并返回特定形状的输出张量。使用Keras 时，你无须担心兼容性，因为向模型中添加的层都会自动匹配输入层的形状。

3.模型：层构成的网络

深度学习模型是层构成的有向无环图。最常见的例子就是层的线性堆叠，将单一输入映射为单一输出。一些常见的网络拓扑结构如下：

双分支（two-branch）网络
多头（multihead）网络
Inception模块

网络的拓扑结构定义了一个假设空间（hypothesis space）。机器学习的定义为：“在预先定义好的可能性空间中，利用反馈信号的指引来寻找输入数据的有用表示。”选定了网络拓扑结构，意味着将可能性空间（假设空间）限定为一系列特定的张量运算，将输入数据映射为输出数据。然后，你需要为这些张量运算的权重张量找到一组合适的值。

选择正确的网络架构更像是一门艺术而不是科学。虽然有一些最佳实践和原则，但只有动手实践才能让你成为合格的神经网络架构师。我们需要构建神经网络的详细原则，也需要建立直觉，明白对于特定问题哪些架构有用、哪些架构无用。