一、前馈神经网络基本模型
前馈神经网络是最基本的神经网络,其中的一些基本概念在神经网络的研究中被广泛的使用。
一个前馈神经网络可以看做是一个函数
fθ:x→y
其中输入
x∈Rn
,输出
y∈Rm
,函数的行为通过参数
θ∈Rp
来决定。
构造一个神经网络,需要的各个要素如下:
1、神经元模型
神经元模型是构建神经网络的基本模块。神经元模型的要素如下:
- 每个神经元的输入为一个向量 x∈Rn ,输出为一个标量
- 决定神经元行为的参数包括一组权值向量 ω∈Rn 和一个偏置项 b
- 每个神经元的输出可以表示为
f(∑i=1nxi⋅ωi+b) - 每个神经元需要满足以上三个条件,可以有多种数学形式。
2、神经网络的基本架构
神经网络的基本架构是以神经元为基础构建的层状网络。基本架构的要素如下:
- 神经元被组织成层状结构,每层的神经元数量根据需要设定。一层中神经元的个数被称为该层的宽度,每一层神经元的宽度不要求保持一致
- 最后一层神经元被称为输出神经元
- 输出神经元之前的各层神经元被称为“隐藏层
- 神经网络中包含的神经元层数被称为网络的深度
- 除了输入层外,每一层神经元以前一层神经元的输出网络输入
- 输出层神经元的输出作为整个神经网络的输出,是根据输出做出的预测或者判断
- 如前所述:一个前馈神经网络可以看做是一个函数 fθ:x→y ,函数的行为通过参数 θ∈Rp 来决定。根据上面的要素,我们把参数 θ 叙述为所有神经元的权重 ω 和偏置 b
- 设计神经网络的一项重要工作就是设计网络的基本架构:即有多少层神经元,每层神经元的宽度。
3、前馈神经网络的矩阵表示
- 我们将输入用一个列向量
x∈Rn 来表示,假设第一层神经元有 p1 个神经元,每个神经元有对应于输入向量的权重向量(行向量) ω∈Rn ,则 p1 个神经元的权重向量组成了一个矩阵 ω1∈Rp1×n 。 - 第一层神经元的输出用一个列向量表示 a1∈RP1 ,且有 a1=f(ω1⋅x+b1) ,其中 b1∈Rp1 是第一层神经元的偏置向量(列向量)
- 第二层神经元的情况与第一层的类似,只是第二层神经元以第一层神经元的输出作为输入,即 a