神经网络之父Hinton介绍及其论文介绍

1简介

杰弗里·埃弗里斯特·辛顿(Geoffrey Everest Hinton),计算机学家、心理学家,被称为“神经网络之父”、“深度学习鼻祖”。他研究了使用神经网络进行机器学习、记忆、感知和符号处理的方法,并在这些领域发表了超过200篇论文。他是将(Backpropagation)反向传播算法引入多层神经网络训练的学者之一,他还联合发明了波尔兹曼机(Boltzmann machine)。他对于神经网络的其它贡献包括:分布特征(distributed representation)、时延神经网络、专家混合系统(mixtures of experts)、亥姆霍兹机(Helmholtz machines)等。

2 论文

2.1 玻尔兹曼机

1985年Hinton等人写的《A learning algorithm for Boltzmann machines》,即玻尔兹曼机的学习算法。玻尔兹曼机是第一个能够学习不属于输入或输出的神经元内部表征的神经网络。

热量均衡下,系统在任一全局状态的概率服从玻尔兹曼分布。玻尔兹曼分布有非常好的数据特性,它与信息理论密切相关。特别地,两个全局状态的log 概率的微分在温度1下刚好等于它们能量的微分。这样容易求偏导数,容易采用梯度下降算法

文中提出模型4-2-4 Encoder,第一个4表示4个可见单元,可以代表输入,2是隐藏单元,最后一个4代表可见单元,可以代表输出。

参考下面文章:

1.1985年 玻尔兹曼机的学习算法–Hinton论文系列《A learning algorithm for Boltzmann machines》
https://blog.csdn.net/zephyr_wang/article/details/120391250
2.2010年Hinton写的《A practical guide to training Restricted Boltzmann Machines》。RBMs(Restricted Boltzmann Machines)的最重要的使用是作为形成深度信念网络的构成模块。RBMs通常采用对比散度(contrastive divergence)的学习过程进行训练
https://blog.csdn.net/zephyr_wang/article/details/120498709

2.2 反向传播

反向传播由下面这些人分别独立发现:(Bryson and Ho, 1975; Werbos, 1974; Parker, 1985; LeCun, 1985; Rumelhart et al., 1986)。反向传播是第一个有效的学习神经网络的方法,神经网络可以拥有一个或多个自适应隐藏单元层。

1986年Hinton等人写的《Learning representations by back-propagating errors》。输入与输出之间隐藏单元的引入,使得计算复杂,采用反向传播。

深度学习的开篇:2006年. G.E. Hinton 和R. R. Salakhutdinov的《Reducing the dimensionality of data with neural networks》
只从1980年代开始,通过深度autoencoder的反向传播(backpropagation)是处理非线性维度下降的一个非常有效分方法,但需要满足3个条件(1)计算机速度足够快;(2)数据集足够大;(3)初始权重有一个好的办法。而现在刚好就满足这三个条件了。
该文提出的模型:(1)第一步预训练,迭代训练很多RBMs,即训练完一个RBM后,将其学到的特征用于训练下一个RBM;(2)接着是Unroll(展开),构成一个深度autoencoder;(3)最后使用反向传播fine-tuning。

参考下面文章:

  1. 1986年,反向传播-Hinton论文系列《Learning representations by back-propagating errors》https://blog.csdn.net/zephyr_wang/article/details/120190585
  2. Hinton论文系列-Reducing the dimensionality of data with neural networks,2006年。https://blog.csdn.net/zephyr_wang/article/details/119878836

2.3 wake-sleep算法

wake-sleep算法,该算法有两个通路,一个是从下到上的识别连接,一个是从上到下的生成连接.

参考下面文章:
wake-sleep算法-Hinton论文系列《To Recognize Shapes, First Learn to Generate Images》2006年
https://blog.csdn.net/zephyr_wang/article/details/120157174

2.4 deep belief nets

2006年Hinton等人写的《A fast learning algorithm for deep belief nets》显示了是有可能学习一个深度、紧密相连的信念网络,一次学习一层。进行如此学习方式的一种是假定当学习低层时,较高的层不存在;但这与简单的因子化相似(替换难处理的后验分布)不相容。为了使这些相似起作用,我们需要真的后验尽可能逼近因子化。所以不是忽略较高层,而是假定他们存在,只是有捆绑的权重,他们满足互补先验分布(Complementary Prior),以使真后验分布可以因子化。这就相当于拥有了一个无向模型,可以使用对比散度(contrastive divergence)有效的学习。

参考下面文章:
Hinton 论文系列《A fast learning algorithm for deep belief nets》2006年
https://blog.csdn.net/zephyr_wang/article/details/120007607

2.5 其他模型

  1. AlexNet .是2012年ImageNet竞赛冠军获得者Hinton和他的学生Alex Krizhevsky设计的。也是在那年之后,更多的更深的神经网络被提出,比如优秀的vgg,GoogLeNet。AlexNet中包含了几个比较新的技术点,也首次在CNN中成功应用了ReLU、Dropout和LRN等Trick。

  2. 胶囊网络CapsNet,2017年
    https://blog.csdn.net/zephyr_wang/article/details/118863203
    现在卷积网络在物体识别领域占据了主导地位,其是否也存在指数性无效率。卷积网络不能很好的处理仿射变换,比如我们可能需要指数级的增加训练样本。
    而本文说的胶囊网络(capsule)可以避免指数性无效率,其将像素强度转换成识别片段的实例参数的向量,然后应用转换矩阵来预测更大片段的实例化参数。转换矩阵是学习部分和整体间的内在关系。

  • 12
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
BP神经网络是一种常见的人工神经网络模型,它是由Rumelhart、Hinton和Williams于1986年提出的。BP神经网络的全称是Back Propagation Neural Network,中文翻译为“反向传播神经网络”。 BP神经网络是一种有向图模型,通常由输入层、输出层和若干个隐层组成。其中,输入层接受外界信息,输出层输出结果,而中间的隐层则通过神经元之间的连接,对输入层和输出层之间的信息进行处理和传递。 BP神经网络的训练过程是通过反向传播算法实现的。具体来说,就是将训练样本输入网络,计算输出值与实际值之间的误差,并将误差逆向传播到各个神经元中,以调整每个神经元的权值和偏置值,从而使得网络的输出更加接近实际值。 BP神经网络的优点在于其具有较强的非线性映射能力和适应性,能够处理多种类型的数据,如数值型、文本型、图像型等。此外,BP神经网络还具有较强的容错性和鲁棒性,即在输入数据有一定噪声或者出现异常情况时,网络也能够保持一定的输出准确性。 然而,BP神经网络也存在一些缺点。首先,它需要大量的训练样本才能达到较好的效果。其次,BP神经网络在处理过程中容易陷入局部极小值,导致网络的收敛速度变慢,甚至无法收敛。此外,BP神经网络的训练过程是一个迭代过程,需要大量的计算资源和时间。 为了解决BP神经网络的一些问题,研究者们提出了一系列的改进算法,如快速BP算法、动量法、自适应学习率算法等。这些算法的目的都是提高网络的训练速度和准确性,使得BP神经网络更加适用于实际应用。 总之,BP神经网络是一种重要的人工神经网络模型,它在模式识别、分类、预测等领域都有广泛的应用。随着人工智能技术的不断发展,BP神经网络仍将发挥重要作用,为实现人工智能的进一步发展做出贡献。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AI强仔

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值