简介
深度学习,按我个人的理解主要就是多层神经网络。
用多层次的分析和计算手段,得到结果的一种方法。
直观表示
从输入层经过多层识别及整合得到输出结果,即输入照片,回答告诉你照片里的内容。
再来一个例子:在手机屏幕上手写2,识别出来你想要写的是2.
神经元和神经网络
深度学习的本质是要理解什么是神经网络和神经元。
神经元:其实是一个数学模型:神经元在我看来其实是 一个 输入值 + 计算方式 + 输出值 。这样一个数学表达式。
一系列的神经元 连接在一起就组成了神经网络。注意:深度学习中所说的连接其实都是一个数学意义上的权值。假设 输入1=a1,输入2=a2,输入3=a3; 权值1=w1,权值2=w2,权值3=w3;输出=z。神经元模型用数学表达式就是: z=g(a1*w1+a2*w2+a3*w3)。其实函数g()又叫 激活函数。如何理解呢?a1*w1+a2*w2+a3*w3的结果始终都是线性的关系,为了引入非线性,强行在输出结果上套了一个这样的函数。
神经网络就是由这样的一系列的神经元,连接(通过权值)起来的。这句话怎么理解呢?就说 在神经网络中,每一个神经元的 输入a 其实是上一个神经元 的输出z。
为什么这样的神经网络 就叫深度学习呢?因为这样的神经网络,其实是可以做预测的。
什么叫预测呢?可以理解为 完成分类任务。
什么是分类任务:给出两张图片,经过这样的神经网络预测之后,可以知道,两张图片是不是相似,相似是一类,不相似是另外一类。
为什么这样的神经元组成神经网络后,就能做分类任务呢?其实可以这样理解:设计好一个神经网络后,组成神经网络的 神经元 都会有一系列的 权值 是未知的。我们用很多,带有共性的 样本去训练网络,其实是在用这个共性来 求解 神经网络中每一个神经元的 权值。这样就完成了一个函数集到准确函数的过程。