数据挖掘:神经网络
感知机
感知机是二分类的线性模型,其输入是实例的特征向量,输出的是事例的类别,分别是+1和-1,属于判别模型。其结构如下:
损失函数
优化方式则是通过利用梯度下降法最小化损失函数
算法流程:
1.初始化权重wi为小的随机值;
2.在满足结束条件前,做如下操作:
初始化△wi为0;
对于在训练数据集中的每个<x, t>,进行:
输入x到单元中并计算输出o;
对于每个线性单元的权重wi:-△wi←△wi + η(t-o)xi;
3.对于每个线性单元的权重wi: wi← wi + △wi;
多层感知机
输入层与输出层之间再加神经元,就是多层感知机,中间的层也称作隐层:
隐层的加入让它能够处理线性不可分的问题(着也要感谢非线性的激活函数),像异或门:
隐层的加入也让梯度变得难以求取,因此引申出反向传播,其主要使用的是链式法则: