####1概述
深度学习入门概述,内容包括网络结构,判别模型和生成模型的基本内容,略带讲解前沿模型和相关总结。
####2神经网络
#####2.1结构:
神经网络是这样的一个结构:
- 输入层有多个输入神经元,然后将输入沿着边传播到隐含层中,每条边有附属的权值,隐含层神经元有自己的偏置。
- 在某个隐含层的神经元中,该神经元的输出为输入神经元的加权乘积和与隐含层偏置的总和。
- 隐含层的神经元输出到输出层中,以此类推,输出层的输出依然为隐含层神经元的的加权乘积和与输出层偏置的总和。
在一个特定的神经网络中,可以有多个隐含层。而且,由于每个神经元的权值和偏置不一定一样,所以对于不一样的输入数据,这些神经元的输出都不太一样。对于较多隐藏层的神经网络我们称为深度神经网络。
网络结构也可以分为两种,监督型和非监督型:
- 非监督型的从最开始的RBM和AE演化到DBN和SAE。
- 监督型的从最开始的单个感知机,演化到多层感知机(MLP,CNN,RNN,RNTN)。
而其他的稀疏自编码,ResNet,InceptionNet等等都是这些网络上的一些优化性改进而已。
#####2.2步骤
对于神经网络而言,最重要的是能恰当配置好隐藏层和输出层神经元的权值和偏置。幸好的是,这个配置是由机器来做,而不是人类。使用神经网络的步骤一般为三个:
- 建立模型,按照业务场景建立网络结构,多少个输入神经元和输出神经元,多少层隐含层,层与层之间是全连接,还是部分连接等等。
- 训练模型,对于已经标记好的大量数据,将它们扔到神经网络中,神经网络通过预测输出与实际输出的差值来自动调整隐藏层和输出层神经元权值和偏置。
- 数据预测,对于新的数据,将他们直接扔到输入层,得到的输出就是预测输出。
#####2.3应用
机器学习的主要用途为分类,聚类,回归,关联规则等等。现有的机器学习方法有SVM,logistic回归,决策树,随机森林等方法。但是,在需要高精度,难以提取特征的无结构化数据机器学习中,深度学习几乎是唯一的选择。
深度学习也有它的问题,它对训练数据很敏感,它的训练目标也是最小化训练数据的训练误差,所以容易受到噪音和过拟合的影响。因此,在一些高噪音的环境下,深度学习是失效的。例如,短期日内股票交易中&