1.1
课程学习内容:神经网络(深度学习算法)、决策树
神经网络:学习工作原理,学习如何进行推断、预测,学习如何训练神经网络
1.2
神经网络的起源、发展
为什么神经网络最近几年才开始起飞?
听过课后觉得应该是因为数据太多了吧
1.3神经网络是如何工作的
例:需求分析
通过T-shirt的价格预测其是否是畅销品
输入特征是price
输出一个概率值,在神经网络中叫激活值
上图是对单个神经元的描述,由图知:神经元的简化模型是一个逻辑回归单元
工作描述:给神经元输入一个或者几个数字,输出一个或者几个数字表示预测出的概率
更复杂的需求分析:
用来预测T-shirt是否是畅销品的特征有四个,预测结果可能取决于中间三个特性。所以需要创造神经元来进行预测。
affordability是price和shipping cost的函数,awareness是marketing的函数,perceived quality是price和material的函数,这三个函数构成第一层的三个神经元,最后输出三个值作为第二层的输入
预测结果是affordability、awareness、perceived quality的函数,构成第二层也是输出层的神经元,最后输出预测结果
每层输出的值,用专业术语说是:激活(activations)
但是,我们需要检查每个神经元决定它从前一层接受什么输入,比如affordability要接受price和shipping cost的值。如果手动输入就会很麻烦,因此神经网络在实际工作中,会接受前一层所有的特性和值。在进行预测时,通过设置参数找出相关的特征子集,如与affordability相关的特征子集是price和shipping cost。
对上一个图进行简化得到下图: 将4个输入特征表示为向量,第一层输出的三个激活值也表示为向量,最后预测出结果。
除了输入层和输出层,中间的层叫做隐藏层。
神经网络的另一种视角:
只看右半部分,可以发现这是一个逻辑回归单元。
需要注意的是:逻辑回归中的输入特征是手动定义,手动输入。神经网络中的特征是网络自动学习出来的
更多层的神经网络示例:
具有多层的神经网络也称为多重感知
建立神经网络时需要自己决定需要多少隐藏层,以及每个隐藏中需要多少个神经元
1.4例子:图像识别
人脸识别
该图像在计算机中是一个1000×1000的网格,也可以称为像素强度值(或像素亮度值)的千乘千矩阵。
将像素强度值展开为一个向量,那么这个向量是一个百万级别的。
人脸识别需要做的是:训练一个神经网络,以百万像素强度值的特征向量作为输入,输出图中人物的姓名。