层级实时记忆(HTM)脑皮质学习算法白皮书笔记

版本0.2, 12,10 , 2010 © Numenta, Inc. 2010
俞天翔 译
HTM相关资料下载链接

第一章 HTM概述

层级实时记忆是一种以捕捉新大脑皮层的结构与算法特性为目标的机器学习技术。

原理

问题:为什么层级组织结构是重要的,HTM 的 区域是如何构建的,为什么数据要以稀疏离散表征的形式储存,为什么基于时间的信息是关键。

  1. 层级能减少训练时间,减少使用的记忆空间,并且提供一种普适的框架
  2. 尽管 HTM 区域叧在一部分上等同于新大脑皮层区域,它可以对复杂的数据流进行识别和预测,因此它可以解决许多问题
  3. 虽然新大脑皮层中的神经元高度连通,抑制神经元保证同一时间叧有至少一部神经元处于活跃状态。因此,大脑中的信息总是通过巨大数量的神经绅胞中的一小部分活跃细胞来表示。 这种编码方式就叫做“稀疏离散表征”。
  4. 为了能够学习,所有的HTM系统在训练时必须接受基于时间变化的输入
  5. HTM的四个基本功能:学习,识别,预测和行为(反应)。行为未包含在内。

学习
当一个 HTM 已经学会其世界的基本组成结构,更多的学习会发生在层级中的更高级内

识别
当一个HTM 学会了模式之后,它就可以对前所未见的输入进行识别。HTM 会在接收输入的时候与以前学过的空间实时模式进行匹配。新输入与旧序列的成功匹配是识别和模式匹配的关键

预测

  • 预测是连续的。举例:当你听歌时你会预测下一个音符,当你下楼梯时候你会预测你的脚什么时候碰到下一级台阶。(攀岩?)
  • 预测发生在层级中的每一层。低级区域可能会预测下一个音素,而高级区域可能会预测下 一个单词或词组。
  • 预测对上下文环境是敏感的。为了预测下一个词,只知道当前的词是远远不够的。(词向量?)
  • 预测是趋于稳定的。HTM的特性之一就是区域的输出会发得稳定—发化的更慢,在更高层级驻留时间更长。
  • 预测可以告诉我们一个新输入是否是期望的。如果下面的输入不符合预测中的任何一个,HTM区域会知道发生了异常。(假如人的大脑发生这样的异常?)
  • 预测有助于增强系统的鲁棒性。如果接收到一个有歧义的声音,HTM 会将它识别成它所预期的结果,这样便帮助了系统在噪音中的识别。(如何判断有歧义和异常?)

行为
我们的行为会影响我们的感知。当我们转动眼球时,我们的视网膜会接收到发化的感官输入。移动我们的四肢和手指会将发化的触觉输入传输到大脑。几乎我们的一举一动都会影响到我们将感受什么。感官输入和运动行为是紧密联系在一起的。
至今为止所有的HTM都是纯感官的,没有一个运动组件。

第二章 HTM脑皮质学习算法

术语

细胞的状态
HTM的细胞有三种输出状态,由前馈输入激活,由横向输入激活(表示预测),以及非活跃状态。
树突区域
每个HTM细胞有一个接近细胞核的树突和许多末端树突。
用一个柱状区域共享的树突来代替每个绅胞上的近核树突。
空间沉积池功能在柱状区域的水平上操作共享的树突。
时间沉积池功能在柱状区域内每个细胞的水平上操作末端树突。
突触
突触代表神经元的输出。
这里包括两个概念:潜在突触和连通值。
潜在突触指所有足够接近树突的轴突可能会形成突触。
连通值指树突与轴突之间的连通性的程度。

综述

一个HTM区域的输入由成千上万的二进制位组成,如何操作这些输入?
作者讨论过的最简单的答案:每个HTM区域寻找输入中共有的模式并且学习这些模式的序列。每个区域根据对序列的记忆来产生预测。
作者从以下三个方面深入探讨:

  • 构建输入的稀疏离散表征
  • 在有先前输入的环境中构建输入的表征
  • 在有先前输入的环境中根据当前输入构建预测

1 构建输入的稀疏离散表征

一个HTM区域从逻辑上讲是柱状区域的集合,一个柱状区域又是一个或多个细胞组成。
HTM区域所做的第一件事是把输入转化成新的稀疏表征。
而输入的稀疏表征就是对哪些柱状区域活跃,哪些在抑制后不活跃的一个编码。
抑制机制主要是为了实现将柱状区域的活跃百分比控制在一个相对稳定的范围内,即便是
有大量变化显著的输入的时候。
在这里插入图片描述

相似的输入(‘1’的个数差不多)会映射到一个相对稳定的活跃柱状区域集合。

这些所有的步骤(建立输入子集到每个柱状区域的连接,决定每个柱状区域的输入水平,使用抑制来筛选一个稀疏的活跃柱状区域集合)被称为“空间沉积池”。
这个术语是指在“空间”上相似(指有着数量众多的相同的“1”)的模式被沉积(指它们组合成一个共同的表征)。

2 在有先前输入的环境中构建输入的表征

区域执行的下一个功能是把柱状区域的表征转换成一种新的包含过去状态或环境的表征。
HTM区域中的每个柱状区域由许多细胞组成。同一柱状区域的细胞有相同的前馈输入。柱状区域的每个细胞可以是活跃的或非活跃的。下图是举例说明。

如果一个细胞被前馈输入激活,我们用“活跃”一词。如果细胞被横向的附近其它细胞激活,我们说它处于“预测状态”。

3 在有先前输入的环境中根据当前输入构建预测

HTM区域所做的最后一步就是做出一个接下来可能会发生什么的预测。预测是基于第二步中生成的表征的,其包含了先前输入所构成的环境。
在这里插入图片描述

用术语“时间沉积池”来表示为表征添加上下文环境和预测这两步骤。通过对模式序
列构建变化缓慢的输出,我们实际上将时间上连续的不同模式“沉积”在一起。

共同的概念

时间沉积池和空间沉积池中的学习是相似的。两种学习都包括在细胞间建立连接,或者说
突触。
时间沉积池负责同一区域内细胞间的连接。
空间沉积池负责输入与柱状区域的前馈连接。
二值权
HTM突触只有0或1两种结果。它们的“权值”是二元的,这一特性不同于其它神经网络模型用0到1的标量变量来表示。
连通值
突触在学习的过程中不停地形成和分解。
我们为每一个突触设置一个标量(0.0到1.0)来反映连接的连通性。当一个连接得到加强时,它的连通值会增加。在相反的环境下连通值会减少。当连通值高于阈值(比如0.2)时,可以认为突触已建立。如果连通值低于阈值则突触失效。
树突区域
突触连接到树突区域。有两种树突区域,靠近细胞体的和处于末端的。

  • 靠近细胞体的树突与前馈输入构成突触。
  • 末端树突区域与同区域内的其它细胞构成突触。每个细胞有多个末端树突区域。如果一个末端树突区域的突触活跃度之和超过了阈值,那么该细胞将会进入预测状态。由于每个细胞存在多个末端树突区域,所以细胞进入预测状态是几个胞内阈值探测器进行逻辑“或”操作的结果。

潜在突触
每个树突区域有一份潜在突触的列表。
所有的潜在突触被赋予了一个连通值并且在该值超过阈值时变成起作用的突触。

学习
学习过程涉及树突区域的潜在突触的连通值的增加和减少。突触连通性增减的规则与“赫布(Hebbian)”定律相似。
举个例子,如果一个突触后的细胞因树突区域接收到的输入超过阈值而激活,那么这个树突区域中突触的连通值将被修改。
活跃的突触,并且因此而有助于细胞被激活的,它们的连通性会增加。
不活跃的突触,并且因此而对活跃无所贡献的,它们的连通性会下降。

空间沉积池概念

空间沉积池的功能主要是将一个区域的输入转化成稀疏模式。

1 使用所有的柱状区域

一个HTM拥有固定数量的柱状区域用来学习如何表示输入中的共有模式。有一个原则是保证所有的柱状区域都学着去表示些有用的事物。
如果一个柱状区域不是很活跃,它会变得更具“侵略性”。

2 维持一定的密度

一个区域需要对它的输入构建一个稀疏表征。
柱状区域的大多数输入会抑制周围其它的柱状区域。而抑制半径与柱状区域的大小成比例,正因有抑制半径,我们只允许一定百分比的柱状区域在大多数输入中成为“赢家”。

3 避免琐碎模式

通过设置激活柱状区域的输入的最小阈值来实现所有柱状区域都表示输入中较重要的模式。

4 避免多余的链接

如果一个柱状区域构成了数量巨大的有效突触就会导致它许多不相关的输入模式都有强烈的响应。
为了避免这一问题,我们减少对柱状区域当前活跃无贡献的突触的连通值。
通过对无贡献的突触进行有效惩罚,我们可以保证一个柱状区域表示有限数量的输入模式,有时只有一个。

5 自适应的感受域

新大脑皮层的区域可以学会表示完全不同的事物并对各种变化做出反应。
如果新大脑皮层中的一部分被损坏,其它部分会调整自身并表示损坏部分所表示事物。
如果一个感受器损坏或发生改变,新大脑皮层中与之相关联的部分会表示其它的事物(即放弃原来所表示的)。
这一系统称为自适应。

如何实现?
在这里插入图片描述

时间沉积池的概念

不太懂…
待补充。

第三章 空间沉积的实现及伪代码

第四章 时间沉积的实现及伪代码

附录 AB…

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lingpy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值