人工神经网络
二分类问题,输出层使用softmax函数,所以输出层有两个神经元,output1表示样本属于类1的概率,output2表示样本属于类2的概率;输入的每个样本有两个特征,所以输入层有两个神经元,隐藏层假设有500个神经元,因为是全连接,所以W1(输入层与隐藏层间的权重)是2*500维矩阵,W2(隐藏层与输出层间的权重)是500*2维矩阵,b1是1*500矩阵,b2是1*2矩阵,b1和b2是偏置项;隐藏层使用双曲正切函数作为激活函数,整个网络的拓扑结构及各层的参数如图1所示,人工神经网络的训练过程就是求W和b的过程。
x表示一个输入样本,在此例中,每个样本有两个特征,所以x=[x1,x2],z1表示隐藏层的输入,a1表示隐藏层的输出,z2表示输出层的输入,a2表示输出层的输出
图1 网络的拓扑结构及各层参数
关于偏置项的理解:
理解为常用误差项,即x1*w1+x2w2+…+xn*wn加上一个与真实值之间的b才能等于真实值,真实值经过激活函数的过滤,输出预测值,如图2所示
图2 偏置项的理解
这是一个分类问题,因此使用softmax分类器,并且使