*深度学习(一)MLP(多层感知机)学习笔记*
1、感知机
我们已经知道了感知机是一个对多输入进行映射到一个输出的模型,虽然用它可以构造出很多逻辑,但是其不能用于非线性的分割。因此通过加多其层数可以获得更好的参数模拟。
2、MLP
多层感知机的本质就是通过在输入层和输出层之间加入一层或多层隐层,并且对于输出可以是一个或是多个,这样建立起来一个模型,每一层和前一层通过一个系数矩阵连接。本质上训练这个模型就是优化各个系数矩阵从而获得模糊系统的函数,例如对于minst集合,我们可以这样建立一个系统,输入1张图片,输出10个相似度,依次对应0-9这十个数字。然后模型的训练目标是将其输出相似度最高的能用于代表手写的实际数字。
对于一个一般的感知机,我们可以建立如下的数学模型:
期中yl代表第l层的输出,ul代表第l层的输入,Wl就是第l-1层映射到第l层的系数矩阵,bl就是第l层对应的偏置。
建立好一层的前向传播的数学模型后,我们可以继续看反向传播的部分
3、反向传播
首先我们定义损失函数: