1. 神经元
1.1 神经元
为了构建神经网络模型,我们需要首先思考大脑中的神经网络是怎样的?每一个神经元都可以被认为是一个处理单元/神经核(processing unit/Nucleus),它含有许多输入/树突(input/Dendrite),并且有一个输出/轴突(output/Axon)。神经网络是大量神经元相互链接并通过电脉冲来交流的一个网络。
1.2 神经元间的沟通
神经元之间通过电信号进行沟通(微弱的电流)。所以如果神经元想要传递一个消息,它就会就通过它的轴突,发送一段微弱电流给其他神经元的树突。
接收到信号的神经元会对消息进行处理,处理后可能会通过自己的轴突再将信息传递出去给其他神经元。这就是神经元之间信号传递的简要概述。
2. 神经网络
神经网络是模仿大脑神经元,建立的模型。模型中的每个神经元都是一个单独的【学习模型】,这些神经元也叫做激活单元(activation unit)
2.1 Sigmod神经元
以下示例为逻辑回归模型中常用的,sigmoid神经元的简单示例:
2.2 三层神经网络和前向传播算法
在Sigmod神经元的基础上,我们可以设计出一个简单的三层神经网络:
神经网络模型中,通常只有一个输入层,一个输出层,中间层/隐藏层可以有任意多个。所有层加起来构成了整个神经网络模型。每一层的输出变量都是下一层的输入变量。
对于上述模型,给每一层添加偏差单位(bias unit)后,图像如下:
输出层表达式:
总表达式:
2.3 神经网络的优势
从2.2节我们可以看到,位于神经网络模型输出层的预测函数可以写作:我们可以把
这就是神经网络模型相比于逻辑回归和线性回归的优势。
3.样本和直观理解
从而:
4.多类分类
当我们要用神经网络模型来实现多分类,譬如训练一个模型来识别路人、汽车、摩托车和卡车。那么神经网络模型改如何构成?
假设我们的输入有三个维度、输出根据上述可知有4个分类,并且是4个互斥的分类。那么我们的神经网络模型可以设计成如下的形状:
我们可以用
、、、
来分别表示输出:路人、汽车、摩托、卡车。