多层感知器(Multilayer Perceptron,缩写为MLP)是一种前馈人工神经网络,它将一组输入向量映射到一组输出向量。MLP可以被看作是一个有向图,由多个节点层组成,每一层都全连接到下一层。除了输入节点,每个节点都是一个带有非线性激活函数的神经元。使用反向传播算法的监督学习方法用来训练MLP。
1.多层感知器结构
①输入层:由多个节点组成,节点数量取决于每组输入包含的值的数量。
②隐藏层:可以有一层或多层,每层节点数量可自由设置,每层的激活函数也可以不一样(甚至可以为每个节点分配不同的激活函数,但这样做并无太大意义,且代码会变得很复杂),本文代码默认所有隐藏层使用相同的激活函数。其中每个节点由一组权重(weights)与一个偏置(bias)组成,权重数量由前一层的节点数量(即前一层的输出数量以及本层的输入数量)决定。
③输出层:大体结构与隐藏层类似,不过某些情况下输出层会使用与隐藏层不同的激活函数或不使用激活函数。该层的输出即神经网络的输出,即预测结果。
因为输入层节点仅储存输入数据,不存在权重、偏置与激活函数,所以在讨论神经网络层数时,不计算输入层,即一个有着5层结构的神经网络实际上包含1个输入层、4个隐藏层与1个输出层。
通常来说,多层感知器的隐藏层数量和每个隐藏层的节点数量取决于许多因素,包括数据集的大小和复杂度、模型的目标以及训练时间等。有一些经验法则可以帮助选择合适的隐藏层数量和每个隐藏层的节点数量,但最终还是需要通过实验来确定最佳配置。而输出层的节点数量和激活函数需要根据问题的类型和目标来确定
2.使用Numpy库创建MLP结构初始化函数
首先定义一个