“千脑计划”正式启动,加入人工智能混战 | 追问观察

cc5d13893dcf9e9350413a8bc506e352.png

追问快读:

1. 今天的神经网络建立在1980年之前的神经科学基础之上,从那以后,人类掌握了更多新的关于神经科学的知识,“千脑计划”希望利用这些知识,通过大脑皮层的逆向工程,开发新的人工智能框架。

2. “千脑计划”主要借鉴了“皮层柱”和“参考框架”这两个大脑处理信息的原理,转换为工程概念,便是“模块化”与“参考系”这两种实现途径。这有望实现更加灵活、智能和适应性强的机器智能。

3. “千脑计划”是霍金斯本人数十载的耕耘与坚持的结果,它的上线不是千脑理论的终点,反而是正式走上实践道路的开始。

在人工智能领域群雄逐鹿的时代,近期被称作“比尔盖茨看好的AI项目”博得了大众的眼球:在盖茨基金会的资助下,“千脑计划”正式启动。

其实“千脑”这个概念并非空穴来风,早在2005年,项目负责人杰夫·霍金斯(Jeff Hawkins)就成立了Numenta科技公司,旨在打造一种基于生物大脑的人工智能。并在2021年,霍金斯出版了名为《千脑理论》(A Thousand Brains)的书。

可以说,“千脑计划”的诞生并不意外,它只是随着科技不断进步,将脑科学理论与人工智能交织的宏伟愿景落地的必经之路。但我们好奇的是,为什么是现在?为什么是“千脑计划”?

e2d0814ca56f86e1bbf8654a367c447d.png

Numenta官网关于千脑计划介绍界面的插图。

ff188541cfa278886f8a11ec530acb13.png

为什么是现在?

目前人工智能领域占据主导地位的依旧是传统的深度神经网络。这些网络中的每一个“神经元”都是独立的计算单元,他们被输入数据,并相互连接共同合作解决问题,涉及的应用广泛,如图像识别、文本预测等。如果神经网络中拥有多层神经元,就被称为“深度”神经网络。这些网络的“神经元”概念和“分层”结构,其实都是受到上世纪生物脑研究启发而建立起来的。只不过这些发现已经是上世纪的、神经科学领域奠基性的工作;自那以后,神经科学与人工智能在各自的深入探索中,似乎也愈发疏远。

目前,深度神经网络在许多应用上的表现已经远超人类,从专业领域的皮肤癌识别,到大众领域的复杂游戏……特别是自从去年大语言模型颠覆了大众认知之后,人工智能的浪潮势如破竹。看似只需依赖庞大的数据和强大的计算能力,人们幻想中的强人工智能似乎总会在未来某一天突然出现。但另一方面,现阶段的人工智能也暴露了越来越多的问题。例如,随着大语言模型规模的增长,其耗费的能源也越来越恐怖。此外,实验还发现,神经网络往往是不稳定的,输入的微小扰动会造成结果紊乱,改变单个像素便“指鹿为马”的错误时有发生。

面对这些不足,人们转而去思考,有没有别的可能,别的途径,来助力人工智能实现更多的突破?为此,“千脑计划”提出的方案是,通过大脑皮层的逆向工程,开发新的人工智能框架。霍金斯表示:“今天的神经网络建立在1980年之前的神经科学基础之上,从那以后,人类掌握了更多新的关于神经科学的知识,我们希望利用这些知识来推进人工智能。”

可以说,“千脑计划“的诞生,是霍金斯本人坚持与沉淀的成果,也是当今时代下人们对人工智能可能的又一次创新性尝试,但它的价值和可行性究竟如何呢?在那之前,我们还得更深入的了解其原理。  

0e569170431242e30b2efdb726047d2c.png

什么是“千脑计划”?

“千脑计划”(Thousand Brain Project, TBP)于今年6月5日在斯坦福大学的人本人工智能中心正式启动,尽管如此,杰夫·霍金斯早为之酝酿多年。根据Numenta网站发布的“千脑计划”技术手册,“千脑计划”共有四个长期计划。

首先,我们必须明了,“千脑计划”的宗旨是一个智能感觉运动系统,它最核心的长期目标是为智能感觉运动系统建立一个统一的平台和通信协议。这种统一的交互协议允许不同的自定义模块通过通用接口进行互动。例如,对于“基于鸟眼优化的无人机飞行”任务,和“使用不同的传感器和执行器来控制智能家居”系统,这两个大相径庭的模块,依照千脑计划的规则,可以实现交互,这使得用户能够根据自身需求开发新模块,同时确保与现有模块的兼容。

其次,正如我们之前所讨论的,为了实现这样通用的交互与通信,“千脑计划”借鉴了对大脑皮层的神经科学研究。事实上,“千脑计划”这个项目名称的来源也和“神经元网络”有异曲同工之妙:大脑皮层由数千个皮层柱组成,每个皮层柱又分成多层神经元。Numenta的研究人员认为,传统深度网络本质上产生的是一个单一的世界模型,从简单的特征到复杂的对象,一步一步地处理数据;相比之下,“千脑理论”则认为,大脑是许多皮质柱生成的多个世界地图的整合,就好像每个人的大脑实际上是由数千个大脑同时并行工作一样。

“千脑计划”的第二个目标是催生一种全新的机器智能思维方式,其原则不同于当今流行的人工智能方法论的原则,它更符合大脑学习的原则。此外,皮层柱之间——也就是不同模块之间的通信是依靠“远程连接”完成的,这与大脑皮层中观察到的脑区间的通讯方式相符。霍金斯认为,这种模块化结构将使他的方法易于扩展,正如在大脑发育过程中有一个关键时期便是多次复制皮层柱。但在技术手册中,Numenta公司也指出,在实际实施中,并不需要严格遵循所有现有的生物学细节,“千脑计划”从神经生物学中借鉴的更多是新皮层的理念和远程连接的思想。

4c7b5575b3dc002bcf690a9e2be9fe00.png

“千脑计划”技术手册中对最终可以实现的实例的图示。具体注释参见https://www.numenta.com/wp-content/uploads/2024/06/Short_TBP_Overview.pdf

第三,该项目开发的人工智能还会依赖于大脑皮层中“参考框架”的研究:在哺乳动物的大脑中,位置细胞会对位置记忆进行编码,网格细胞会帮助绘制空间中的位置。大脑皮层使用这些参考框架来存储和理解它接收到的持续不断的感觉运动数据流。“千脑计划”旨在将这些已有的神经科学发现整合到一个框架中,霍金斯解释说:“大脑在二维和三维坐标系中构建数据,复现了现实世界中物体的结构。反观深度网络,它们并不能从根本上理解世界,这就是当我们仅仅改变图像微小特征时,深度网络便无法识别它们的原因。而利用参考框架,大脑便能够理解物体模型在不同条件下的变化。

最后,我们还需要意识到“千脑计划”作为软件开发工具包的本质。开发者期待它可以解决尽可能多样化、多种类的任务,便于用户之间的交流与使用,以及相互间的应用和测试。

总结来看,千脑计划本质是一个针对机器人感觉运动系统的软件开发工具包,只是会在开发过程中引入一些神经科学的原理。霍金斯提到,这项新的人工智能平台的应用可能包括复杂的计算机视觉系统——例如可以使用多个摄像头来解析场景中正在发生的事情,或者先进的触摸系统来帮助机器人操纵物体。

“盖茨基金会对促进全球健康的感觉运动学习很感兴趣。以我们熟悉的超声波为例,它在给胎儿进行成像时,其实正是在通过移动传感器来建立模型,这本质上是一个感觉运动问题。”因此,盖茨基金会对这一项目的可行性分析更多是从工程角度进行的。

e37041e2b67f1ccd262472e4a61f953b.png

“千脑计划”如何实现?

据前文介绍,“千脑计划”的具体实施方式,主要借鉴了“皮层柱”和“参考框架”这两个大脑处理信息的原理。转换为工程概念,便是“模块化”与“参考系”这两种实现途径。具体而言,在“千脑计划”系统中有三个主要模块:传感器模块、学习模块和执行器模块。它们相互关联,并通过统一的通信协议,让每个模块都具有适当的接口,使得内部工作原理具有高度的灵活性。

霍金斯在采访中曾表示:“一旦我们学会了如何构建一个皮质柱,我们就可以随心所欲地构建更多的皮质柱。”那在“千脑计划”中,每个模块自身是如何实现的呢?

Numenta公司关于“千脑计划”实现原理的介绍视频。https://www.youtube.com/watch?v=LaAYuygr7_8&ab_channel=Numenta

首先,传感器模块负责接收和处理原始感官输入,“千脑计划”的基本原则中规定,任何特定模态(视觉、触觉、雷达、激光雷达等)的处理都需在传感器模块中进行。每个传感器模块都像视网膜一样,从一个小的感官区域收集信息——无论是一块皮肤区域的触觉,还是一只小鼠胡须上的压力信息。这些区域化的原始数据被传感器模块转化为统一的数据格式,传递给学习模块,这类似于视网膜将光信号转化为电信号的功能。此外,传感器另一个重要功能是进行坐标系的转化,即计算出特征相对于传感器以及传感器相对于“身体”的位置,从而确定特征在身体坐标系中的位置。总结来说,传感器模块会以一种通用的形式将当前位置以及在该位置感知到的外部刺激传递给学习模块。

7612b78eb5af50cf5d420bd7e45073a0.png

传感器模块接收和处理原始感官输入。然后,通过通用通信协议将其传达给学习模块,该模块使用它来学习和识别环境中任何事物的模型。

学习模块是“千脑计划”中最核心的部分,它负责对来自传感器模块的数据进行感觉运动处理和建模。每个学习模块都是一个独立的识别单元,当它们结合使用时,可以显著提高识别效率(比如,用五个手指摸一个“杯子”以识别它,会比用一个手指快得多)。学习模块的输入可以是来自传感器模块的特征ID,也可能是来自低级学习模块的对象ID——但它们依旧被会被处理成特征ID。这些特征或对象ID可以是离散形式(例如“红色”、“圆柱体”等),也可以在更高维空间中被表示(例如表示颜色的稀疏分布表示)。此外,学习模块会接收相对于“身体”的位置信息,以自身为中心的这种参考系将空间整合为统一的计算框架。

基于以上描述的特征和位置信息,高级学习模块可以建立“组合对象”(例如组合体或完整的场景)。除了按照上述“独立学习特征”和“使用统一参考系”的方式学习新模型之外,学习模块还会通过侧向连接,使用统一的通信协议与其他学习模块进行通信,这种通信——与学习模块类似——是独立于具体模态的。因此,在不同模态下学习对象的学习模块可以相互竞争或交流而“达成共识”。

通过内部独立计算和与其他学习模块进行交流后,学习模块便可以确定一个对象的ID及其位置。它可以利用最近的观察来更新该对象的模型,从而不断了解更多关于世界的信息。“千脑计划”的实现,强调学习和理解是两个相互交织的过程。

8331575df94b7f2983f2325a0e7cb3a3.png

学习模块使用参考系通过感觉运动交互学习结构化模型。它们对传入特征在空间和时间上的相对排列方式进行建模。

除了“传感器-学习模块”这样最简单的连接模式,由于通用通信协议的存在,系统可以轻松在多个维度上进行扩展,横向连接多个学习模块,可以通过它们之间的相互交流来提高系统的鲁棒性;而纵向连接学习模块,将它们堆叠在一起则可以实现更复杂的分层输入,来处理和组合建模过程。除了这种跨空间尺度的学习方式,“千脑计划”甚至可以实现不同时间尺度的学习:低级模块可以缓慢地对输入的统计特征进行学习和归纳,而高级模块则用来快速的建立对当前外部状态的瞬时预测,充当一种短期记忆功能。

每个学习模块都会产生一个运动输出,其形式是一种遵循通用通信规则的“目标状态”:目标状态是通过学习模型和一定的假设计算出来的,可以最大程度减少不同可能的对象模型之间的不确定性。也就是说,目标状态可以用来指导系统的行为,使其朝着预期的目标前进。

6d9a68f84c45f5fec58bc0ca88b425d1.png

通过在传感器模块和学习模块之间使用通用通信协议,系统可以很容易地在多个维度上进行扩展。这为处理来自多种模式的多种感官输入提供了一种直接的方法。将多个学习模块并排使用可以通过它们之间的投票来提高鲁棒性。此外,将学习模块堆叠在一起可以对输入进行更复杂的分层处理,并对组合对象进行建模。

以上仅介绍了三种模块的基本功能和联系,事实上三者可以实现更灵活的连结和更丰富的行为,这些都在技术手册中有所介绍。笔者特别感兴趣的一个功能是:现在的学习模块可以存储已学习的模型,并用它们来预测未来的观测。当这些模型整合起来对当前的观测进行预测时,预测的误差可以作为输入,用于更新模型。这种反馈信号的使用方式,与强化学习中的模式相似,在“千脑计划”中也有所体现。

但手册中也指出,目前“千脑计划”的预测还无法实现实时更新,未来将会引入时间维度来实现这样的功能,这将对对象的行为编码和运动策略规划大有助益。例如,这种功能可以应用于观察按下订书机的连续过程,或者粗略模拟常见材料的物理特性等场景。

24134fbe7f1c6bcf2f26c4856f1f1ea8.png

为什么是“千脑计划”?

回到最初的问题:在人工智能和脑机接口领域都处于风口浪尖的时代下,为什么盖茨基金会决定在未来两年内向“千脑计划”提供296万美金的资助呢?笔者不试图评价盖茨基金会咨询团队的判断,仅从重要性和可行性两个角度来发表一些个人的看法,并作为对“千脑计划”介绍的总结。

“千脑计划”是一项旨在通过仿生学和神经科学理论构建新一代人工智能系统的研究项目。一方面,通过模仿大脑皮层的工作方式,开发能够感知、学习和执行动作的智能系统,在医疗、社会健康等领域有很深远的现实意义。这些技术不仅有助于提高生活质量和社会健康水平,还能有效应对未来社会面临的各种挑战和公共卫生危机。支持这样的技术发展和应用,符合人们对智能化与人性化社会服务的期待。

此外,“千脑计划”对未来人工智能和计算机技术发展也有深远影响。当前的深度神经网络通常需要大量的标注数据集来进行训练,并且缺乏对动态环境的实时适应能力。与之不同,“千脑计划”试图通过仿生学方法,将分层和并行处理的能力带入到人工智能系统中,能够实现更加灵活、智能和适应性强的机器智能。关于是否应该在人工智能中借鉴生物大脑的争议一直存在,这是一个复杂的问题。无论选择何种路径,最重要的是如何有效实现。

在技术实施上,“千脑计划”旨在创建一个完整的软件版皮层柱,并通过连接多个这样的单元来实现复杂的感知和行动过程,如视觉和听觉。这种跨模态的整合能力将允许系统同时处理来自不同感觉通道的信息,从而更好地理解和互动世界。

这种想法也许并不如我们预想的那般异想天开,它来自于霍金斯本人数十载的耕耘与坚持。在正式宣布启动之后,Numenta公司官网立即上线了“千脑计划”进展页面,并表示将在未来不断更新最新进展。可以说,“千脑计划”的上线不是千脑理论的终点,反而是正式走上实践道路的开始。对于其未来的发展还有太多不确定性,没有人可以对其成功与否下明确的定论,但这正是科研工作中的乐趣所在。

7889cd4774279c064fa5f26e220245b2.png

4b43836543b099a5ae1cb49b44b39b0e.png

2307090c3383bd88c242d9764dd75b47.png

a37cf0993b6c96ce53a1b641e6c2d9b7.png

42d6146f592cbea7ad17974b173c96a7.png

920bf5ed1b2e13fb182e102b002af110.png

1a50d1c61fc6f10ca4950d6af65ae851.png

关于追问nextquestion

天桥脑科学研究院旗下科学媒体,旨在以科学追问为纽带,深入探究人工智能与人类智能相互融合与促进,不断探索科学的边界。如果您有进一步想要讨论的内容,欢迎评论区留言,或添加小助手微信questionlab,加入社群与我们互动。

关于天桥脑科学研究院

天桥脑科学研究院(Tianqiao and  Chrissy Chen Institute, TCCl)是由陈天桥、雒芊芊夫妇出资10亿美元创建的全球最大私人脑科学研究机构之一,总部设在美国。TCCI与华山医院、上海市精神卫生中心设立了应用神经技术前沿实验室、人工智能与精神健康前沿实验室;与加州理工学院合作成立了TCCI加州理工神经科学研究院。TCCI建成了支持脑科学研究的生态系统,项目遍布欧美、亚洲和大洋洲,包括学术会议和交流、夏校培训、AI加速科学大奖、科研型临床医生奖励计划、特殊病例社区、中文媒体追问等。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值