nature reviews neuroscience：前额叶学习的时间尺度

最新推荐文章于 2025-03-27 16:30:45 发布

悦影科技

最新推荐文章于 2025-03-27 16:30:45 发布

阅读量1k

点赞数 14

文章标签：算法前额叶

本文链接：https://blog.csdn.net/weixin_41880581/article/details/144580352

版权

在人类和其他灵长类动物中，侧前额叶皮层（PFC）对于即时的、目标导向的行为和工作记忆至关重要，这在经典上被认为与支持长期学习和记忆的认知和神经回路是不同的。然而，在过去几年中，人们对这种教科书观点进行了重新考虑，即在追求即时目标的过程中，不同时间尺度的记忆引导行为不断相互作用。在这里，我们首先详细介绍与目标导向行为最短时间尺度相关的神经活动（需要在工作记忆中维持当前状态和目标），以及如何通过长期知识和学习塑造这些活动 — 即过去如何影响当前行为。然后，我们将概述从秒到年的不同时间尺度上的学习如何驱动灵长类动物侧前额叶皮层的可塑性，从单个神经元的放电率到中尺度神经影像活动模式。最后，我们将回顾在学习的几天和几个月中，PFC中密集的局部和远程连接模式如何通过改变突触权重和招募额外的神经资源来促进种群活动的持久变化，以指导未来行为。我们的综述揭示了PFC回路中可塑性机制如何促进通过时间整合学习经验以最佳地指导适应性行为。

1. 简介

为了在世界中生存并以适应性行为，我们必须从过去的经验中汲取教训。无论这种生存是否涉及记住通往一个特别多产的香蕉树的方向，还是在市场上购买香蕉时记住一个食谱，记忆都指导着我们当前的目标。记忆经典上被分为三部分（图1），首先包括一个图像式感觉记忆系统，它能够在物理世界的详细图像在不再可用后仅维持短暂的一小部分时间（大约200毫秒左右），被认为存在于感觉皮层（例如视觉皮层）。在另一个极端是长期记忆（LTM），存储着感兴趣刺激的简化版本，可以持续从几分钟到几年，依赖于颞叶内侧（MTL）。最后，工作记忆（WM），即维持和操作不再可用的感觉信息的能力，将我们的即时过去与未来行动联系在一起，被认为出现在前额皮层（PFC）。

这个记忆划分基本上是有缺陷的。前面提到的每个大脑系统都能够在所有记忆时间尺度上发生可塑性。感觉皮层中神经元的反应会随着经验发生长期变化，被称为“知觉学习”。颞叶和海马区在使用新物品和高工作记忆负荷的各种工作记忆任务中活跃，并且单个神经元在单项目工作记忆任务中表现出持续活动，类似于工作记忆中前额皮层的经典发现。通过重新考虑经典案例研究和现代神经心理学工具，已经显示颞叶损伤会导致长延迟期（大于几秒）的工作记忆任务以及单个项目的缺陷。关联皮层的分布区域也表现出长期学习，并通过一种混合了感觉和前额皮层特性的方式提供工作记忆功能。

然而，前额皮层可能最明显地展示了不同时间尺度的记忆引导行为如何在几秒钟内相互影响，即使在追求即时目标的过程中也是我们综述的焦点。

在本文中，我们概述了一个“前额学习”框架，其中前额皮层中的整合学习系统可以解决关于记忆过程和目标导向行为运作的基本问题。我们概述了在工作记忆维持期间受长期记忆因素影响的前额皮层中的活动变化。我们回顾了与前额皮层相互连接的扩展分布区域，据报道这些区域显示了工作记忆延迟活动。此外，我们强调了前额皮层如何以何种方式和何时促进工作记忆，也可以通过考虑它与其他区域和长期记忆系统的相互作用来更好地阐明。正如我们将详细介绍的那样，展示了工作记忆如何随着熟悉和熟练的刺激和任务而变化的观察，需要长期记忆系统的参与，并利用长期记忆的分布式神经机制来增强工作记忆容量。有关前额皮层及其在工作记忆行为中的作用的基本问题存在争议，跨任务、刺激和物种的数据似乎存在冲突。关键的是，基于前额皮层的工作记忆回路与其他记忆系统之间的联系阐明了研究和尺度间工作记忆发现的模式。我们提出了在前额皮层中跨时间尺度整合学习和记忆的三个主要主题：（1）长期学习对工作记忆的塑造，受到并涉及部分重叠的长期记忆过程的神经基质的影响；（2）灵长类动物前额皮层独特的解剖和功能倾向，促进了活动模式的可塑转变；以及（3）学习后前额皮层中神经活动变化的性质，从尖峰放电到大尺度模式，活动空间 —— 神经活动模式的主要结构 —— 在培训和学习的几秒、几分钟和几个月内发生转变。

图1 长、短期记忆系统的连接和时间尺度

2. 学习统一了PFC功能

在19世纪末，心理学家们曾努力寻找学习和记忆的普遍理论。Tulving（2007）曾将这与雨伞进行了比较：“‘记忆’这个术语本身已经成为一个涵盖所有不同类型的总称，心理学家曾梦想提出一种全面的‘记忆理论’的梦想已经变得与心理学家对雨伞的理论一样无关了。” 即使是学习的正式定义，更不用说普遍理论，至今仍然难以捉摸。Rescorla和Holland提出了一个简单的框架，用于描述生物体在两个时间点的经历之间的差异，然而，我们扩展了如何整合这些潜在的学习时间尺度上的巨大差异。即使在所谓的“仅”专注于工作记忆或短期记忆任务范式时，影响仍然会延续不同的任务时期，甚至跨越单个试验。这种持续的经历然后指导我们的“前额记忆”。

灵长类动物的进化大脑复杂性与工作记忆容量、精度、抗干扰能力和物品切换能力的提高相一致。为了研究这些工作记忆能力的生物学基础，大约50年前Fuster进行了关于工作记忆的第一次神经元记录。从那时起，在表征信息在工作记忆期间如何维持的单元、群体和整个大脑水平的基质方面取得了实质性进展，包括维持和操作工作记忆内容的计算机制，以及皮层和亚皮层人口在促进成功的工作记忆行为中的潜在不同作用。然而，多个神经和认知学习和记忆系统并不独立运作：即使是最简单的工作记忆任务（例如，在延迟注视范式中记住视觉刺激的位置）也显示出学习、练习和长期偏差的影响。这种不同时间尺度上的学习和记忆塑造了我们的目标导向行为。

关于前额皮层在工作记忆中的作用存在着跨研究、物种和方法的持续争论；关于支持工作记忆的神经活动基质（持续放电的产生与突触变化）；以及关于工作记忆维持的位置（前额皮层与分布于整个大脑之间的多种程度）等问题。我们认为，考虑到学习可以更好地理解看似矛盾的研究结果的认知和神经驱动因素。也就是说，学习不仅告诉我们神经过程如何在实验时间点之间变化，还阐明了工作记忆本身的基本特性。例如，在工作记忆中信息维持的机制也显示出多种属性，传统观点认为在细胞的循环网络中有更稳定、持续的尖峰放电，与动态、“活动静默”或基于突触的信息维持形成对比，其中尖峰放电用于刷新连接权重模式。然而，考虑到叙事记忆和学习机制可能会统一这两种观点。工作记忆和长期记忆之间的平衡工作是为了维持信息以实现最佳行为利用：对于在长时间延迟期间或在注意力焦点之外维持的信息，叙事记忆过程可能与基于突触的工作记忆的观察相呼应。因此，传统上被认为是持续维持信息的前额皮层回路也可以被理解为是长期可塑性的关键中枢，将即时工作记忆与知识结构和特定记忆或经历的长期结构联系起来。

工作记忆（WM）通常是通过以秒为单位的任务范式进行研究的：在经典的工作记忆任务中，一个刺激会被短暂呈现给被试，然后在他们必须做出反应之前移除。例如，他们可能被要求报告记忆刺激的身份或位置，或指示第二个刺激是否与第一个匹配。在刺激和响应之间的时间，即工作记忆的“延迟期”，在这段时间内，神经元活动模式必须维持对被试者不再可用的感觉内容，这引起了极大的兴趣。在多年的实验中，实施（主要是）这种一项任务、延迟注视/反注视或单项视觉匹配/非匹配范式的实验，发展了支持这些成功工作记忆的基础模型。这些研究的结果表明，前额皮层中的神经回路表现为连续吸引子系统，维持其激活模式在延迟期间持续。有限的持续时间和容量是工作记忆的定义特征，也是研究的核心议题。这些瓶颈可能源于在电路中以尖峰活动维持信息的需求，以及中介它们的神经元的固有属性，而不是长期突触连接的模式。

来自电生理学、人类功能性神经影像学和计算模型的证据显示，灵长类动物侧外前额皮层在没有感觉输入的情况下扮演多种不同角色，以支持工作记忆行为。前额皮层中的活动模式与延迟期间精确刺激信息的维持相关联，与其他联想和感觉区域协调一起。前额皮层发挥多重控制信号，管理适应上下文的反应，包括在延迟期间对时间本身进行编码，并执行输入-输出门控功能，使刺激进入或从工作记忆中被选中。在这些情况下，通过将前额皮层视为存储即时工作记忆内容的孤立吸引子系统，可以学到更多。

尽管我们主要关注长期记忆对工作记忆的影响，但这些相互作用是双向的，因为侧外前额皮层和内侧颞叶连接可以控制长期记忆的编码和检索过程。计算模型表明，前额皮层输入到内侧颞叶结构（如海马回）的输出结构，如海马回可控制依赖海马的学习。在人类的实证数据中，侧外前额皮层的活跃性可以调节特定记忆的适应性召回和有意遗忘。较短时间尺度的工作记忆维持和快速的统计学习路径甚至可能会损害叙事记忆的长期巩固，表明工作记忆和其他神经回路对记忆系统的控制程度很明显，并根据当前和未来的目标平衡记忆系统的需求。

3. 长期记忆增强工作记忆表现

长时间尺度的学习可以提升工作记忆（WM）能力，使一个容量受限的系统能够在刺激有意义或明确利用来自长期记忆的结构化知识时表现超出典型限制。例如，通过长期记忆的学习，‘记忆运动员’可以利用知识系统快速编码数百个项目的序列，而相比之下，即时工作记忆的积极维持通常受限于4-7个项目。较短的工作记忆时间尺度与任务会话中更长的基于奖励和选择的学习过程相互作用，并与跨几分钟内刺激之间的时间或序列关联的隐式统计学习相互作用。在这些情况下，尽管每次试验的工作记忆行为的目标是根据立即相关信息做出响应，但过去的经验可以提升（有时也可能“损害”）表现。例如，随着时间的推移，具有深厚熟悉度的有意义刺激，如宝可梦、面孔或现实世界物体，相对于无深入刺激熟悉度的刺激或与没有广泛刺激熟悉度的个体相比，显示出工作记忆表现的相对好处和能力增加。这种工作记忆表现的提升被认为源于在编码期间更深层次的项目巩固，减轻了在工作记忆延迟期间对高能量维持的需求。

然而，重要的是要考虑到工作记忆容量限制不太可能仅仅是神经结构的限制；对于由数千个单元组成的电路来说，将超过七个项目存储为神经活动模式是微不足道的。这可能更多地解释为生物物理资源和权衡的问题 —— 有时被称为容量的“资源合理”解释。限制工作记忆系统的神经回路原则（即使在奖励或训练的情况下）仍然是基本利益所在，值得探讨，无论确切的环境或其他因素可能有助于解释为什么存在有限容量系统。

物品的联想记忆结构还将工作记忆与更分布和更长期的物品特定表示联系起来，这些表示被插入到模式（个体项目之间的结构化关系形成组或模型）中。例如，经过长期工作记忆训练（长达几周至几个月）的复杂分形刺激任务中，WM表现得到提升，即使单独展示，也可以检测到物品的分类刺激信息。这可以通过强烈编码的长期记忆表示来解释，这些表示可以用于工作记忆的编码和维持。事实上，有人认为，单一工作记忆项目的维持是记忆激活连续性的高端，几乎没有区别或承认在维持工作记忆内容和传统的MTL-皮质回路之间的深层互动。

学习并不是对工作记忆能力的无限提升：训练和学习的效果通常是具体的，而在工作记忆和其他认知范式之间的远距认知转移是值得怀疑的。此外，学习和记忆系统之间存在不断的权衡，根据目标使用：学习经验可能会在某些环境中阻碍我们，但在其他环境中提升我们的表现。特定长期记忆事件和背景的重现可能导致工作记忆的分心，并偏向于即时决策，通过增加对熟悉信息的干扰敏感性扰乱理想行为。那么，交互学习系统的效用是什么？毕竟，记忆系统的分离是否会导致更高效、更高容量的工作记忆处理？首先，工作记忆系统与更慢的强化学习系统平衡协调工作，根据任务需求和刺激负荷调节基于奖励的响应。在学习多步游戏后，专家受益于在游戏过程中提升工作记忆。也就是说，专家依赖更深层次的规划 —— 思考游戏中下一个序列并在做出移动时记住它们 —— 并能够将即时动作与他们过去的经验目录联系起来。因此，工作记忆与学习的最长时间尺度和更快速的行为系统相互作用，促使我们考虑在进行甚至一个实验范式时我们正在研究多少内容。

4. PFC是整合学习系统

灵长类动物和大猩猩，特别是，展现出显著的工作记忆（WM）和学习能力，不同物种之间的差异与行为和大脑组织复杂性的增加相一致；然而，研究结果在人类和非人类灵长类动物（NHPs）之间难以比较。值得注意的是，大多数NHP的电生理学或神经影像学研究是在广泛的任务和刺激熟悉度之后进行的，比人类要多得多，后者在进行WM范式之前只遇到任务规则。一个著名的例子是，研究人员报告了一只黑猩猩受试者在空间WM任务上表现出色，甚至比一组本科生更出色。然而，一个简单但揭示性的解释似乎是，经过相同数量的训练后，幼稚的本科生可以轻松超越这只黑猩猩受试者。

在为即时、短期目标指导行为的同时整合重复学习的知识，赋予了进化优势，并与行为发展如使用工具等行为相呼应。经典的损伤研究指出前额叶皮层（PFC）是这种复杂认知的中心，PFC在灵长类动物和人类进化中得到了扩展。物种之间的差异可能与WM存储本身的固有限制或扩展有关，或者与学习和整合规则和上下文信息以供WM使用的能力有关。在纯粹的WM表现中，人类显示出比NHP更大的容量，而黑猩猩在WM的灵活更新方面与人类4-7岁的儿童相当。学习本身也在人类和NHP之间存在差异——在经典的卡片分类任务中，需要受试者根据隐含规则对卡片进行分组并在规则之间进行切换（例如颜色和形状），NHPs通常能够表现出色，但他们会出现更多坚持性错误（即在规则切换后未能改变方法），并且比人类需要更长时间学习规则，类似于具有侧前额叶皮层损伤的人类患者。NHPs和人类都可以进行显性学习，但NHPs比人类更慢地检测隐性的抽象任务规则。因此，PFC被视为研究灵长类动物WM进化和理解学习机制的关键支点。我们讨论侧前额叶皮层的三个主要结构特征，为不同时间尺度上的学习提供了神经计算资源和整合：密集的颗粒状金字塔细胞层有助于维持WM中的即时信息。侧前额叶皮层是一个高度颗粒状的、片层结构的皮质区域，具有密集的第III层大金字塔细胞体，这些细胞作为灵长类相对于啮齿类和其他哺乳动物种类扩展的皮层类型的关键微解剖特征。将神经示踪物注入侧前额叶皮层的第III层显示出皮层微柱，即相邻的、密集的局部投射细胞群，这些细胞在层间具有类似的功能特性，然后通过第V和第VI层的深度输出连接到侧前额叶皮层的其他区域。这些颗粒状的第III层细胞及其局部群体为通过吸引子状态维持WM的模型奠定了基础，这些状态持续几秒钟，并且它们输入和尖峰的持续总和（激活时间尺度约为150毫秒）被认为相对于联合皮层其他区域提供更一致的循环活动模式。

(2) PFC内部强大的相互连接性和与大脑其他部分的长程连接“地图”的输入-输出功能。前额皮层的基础理念将其定位为一个整合节点，以促进学习，而最近的神经解剖学进展揭示了支持这些整合功能的局部和全局结构。在前额皮层内部，“微柱”之间的局部连接形成了分布式但部分重叠的局部回路，并且可以同时存在多个WM或其他表示形式——例如，多个刺激、目标、行动计划和背景表示可以在同一前额皮层区域中叠加或汇聚。此外，在微柱内部，金字塔细胞之间密集的侧向连接支撑了在WM延迟期间活动模式的重复激励。这种多路功能和神经解剖学组织从电生理记录中得到了一些暗示，但认为低于功能性神经影像可能实现的毫米级分辨率，因此使用这种方法无法检测到，跨尺度和不同研究的物种之间的比较是必不可少的。PFC内部和外部的长程连接也形成了大脑其他部分的连接“地图”，几乎连接到所有感觉运动和联合皮层。从PFC到皮质下的连接模式也形成了从PFC到丘脑和纹状体靶区的深层输出回路，促进多个重叠表示的切换和控制。例如，在WM中选择特定项目时，侧前额叶皮层和纹状体的功能连接增加，丘脑核控制PFC表示的信号和噪声水平和时序。例如，规则逆转学习通过皮质-纹状体相互作用得到促进，WM和强化学习在PFC和纹状体奖励预测误差信号中互相影响。最后，侧前额叶皮层通过大脑内嗅叶皮层、副嗅皮层和顶枕皮层等MTL和联合皮层，接收大量间接输入。嗅叶皮层与侧前额叶皮层之间特别密集的递归连接，作为反馈到海马区域的区域的输入结构。对于灵长类侧前额叶皮层，来自海马区域本身（subiculum）和前海马区域的直接连接，作为直接输入进入侧前额叶皮层和循环WM回路。这些连接通过长程投射和PFC网络中随时间的权重变化，实现对长期记忆过程的计算控制功能，以及通过长程投射和PFC网络中的权重变化，实现WM回路。

图2 不同组织水平的侧前额皮层神经活动时间尺度

(3) 神经化学状态调节PFC的基调，以适应短期和长期的学习和行为。来自多种深层神经调节源的投射向侧前额叶皮层提供神经化学基调，包括多巴胺能（即D1R受体）、胆碱能和其他神经化学和激素信号，这些信号在PFC功能中提供状态依赖性的变化。经典上，这些发现可以广泛总结为“倒U”效应，即神经化学基调的最佳峰值可以为当前任务创造理想的表示或活动水平。然而，这种曲线在任务和时间尺度以及不同形式的“理想”表示之间变化，一些对WM回路动态的神经化学调节可能对几秒钟内有益，但在几分钟到几小时的延长影响中有害，这取决于神经和行为状态。神经化学因素在PFC的细胞和连接结构之上提供调整，需要更多的理论和实验工作来理解神经化学如何在电路水平上影响表示和行为。

4.1 PFC活动模组适应不同学习

在学习过程中，我们实际上可以检测到PFC中的哪些神经信号？进行任何认知任务会引起PFC的强烈激活，并出现代表与任务中包含的感觉刺激以及定义任务的规则和条件相关的各种变量的神经活动。在人类神经影像学中，侧前额叶皮层和其他联合区域显示出高激活和招募，在多项研究中表现出激活（有关PFC和其他区域在各种认知任务中的激活描述，请参见参考文献117,118）。PFC中的个体神经元根据任务规则展现不同水平的活动，例如，当被试被提示需要对匹配或非匹配刺激作出反应时，尽管试验可能涉及相同的刺激。在人类神经影像学的规模上，侧前额叶皮层区域沿着前后轴呈现出分层梯度，对认知任务中学习的不同规则和控制水平做出响应。类似地，前额叶皮层神经元对已学习的物体类别或需要做出感知决策时的物体数量具有选择性。在受训练后，已知会调节前额叶皮层神经元的其他因素包括奖励期望或任务的一部分的特定事件序列。

最近，这种在多种任务条件下的灵活调整被描述为“混合选择性”，据推测可以在仅有少量PFC神经元的情况下实现具有意义的复杂表示，同时实现有效的下游读出。尽管如此，根据任务变量，一组记录的神经元中检测到的特定计算模式（例如，神经维度或人口响应的几何形状）仍然有所不同，因为学习塑造了观察到的神经元响应模式。反映任务变量的特定神经几何形状，如刺激位置或顺序，会根据任务因素而出现。根据特定任务目标和训练方案，甚至会观察到看似相反的模式：在不可预测的任务中出现动态编码（神经群体编码随时间变化），而在更可预测的任务中出现稳定编码（随时间点一致的群体编码），在学习后，WM活动模式的表征维度可以在不同的认知任务中是高的或低的（图2）。

4.2 大尺度神经募集

在研究之间梳理差异是复杂的，这是由于训练和“之前”和“之后”学习阶段之间的时间间隔。在经过足够数量的训练和跨学习阶段的观察之后，主要效应表现为在通过学习的刺激和任务背景招募的扩展区域中的活动增加。这些变化包括在出现有意义刺激后被激活的神经元数量增加（即，在学习后，额叶皮层内和跨区域内有更多神经元表示任务事件或刺激），以及最初活跃神经元的发射率增加。计算模型表明，从这些神经生物学和代谢约束中出现具有不同选择性的细胞类型，并且重复使用分布式表示以用于任务组件使得在任务间实现泛化。对于行为需求的时间变化的灵活性也更高，因为神经元以各种时间信封发放，而不是均匀激活。最后，PFC内部和跨区域的连接模式有助于通过皮质-亚皮质回路来组织这种灵活的工作记忆任务表示（图3）。

图3 使得侧PFC成为学习过程理想hub的神经生理特征

招募更多神经元群，以更高的速率发放，可能会导致在人类神经影像学研究中检测到的血氧水平依赖功能磁共振成像信号的变化，这些研究报告在工作记忆任务中训练后激活区域的扩展。然而，其他研究表明，认知训练后前额叶区血氧水平依赖活动减少，并通常被解释为处理效率的提高。然而，在非人类灵长类动物模型中的神经生理学研究也揭示了一些训练后发射率降低的情况（例如，在某些训练方案中背景活动的沉默），这解释了为什么在神经影像学的长时间常数和空间尺度上进行平均可能不一致，或者看起来学习/训练抑制了神经活动的总水平。关注学习的时间尺度和在学习过程中可检测到的各种不同效应对于观察PFC模式随学习变化的模式至关重要，需要更具纵向性、高抽样率的学习研究：学习前后的所有时间点并非相同。

训练引起的神经活动变化并不总是可以通过影像研究检测到，因为它们可能引起的不仅仅是平均发放率的变化。训练会减少从试验到试验中发放率水平的变异性，这可以通过连续试验中尖峰计数的Fano因子（方差除以均值）来量化。同样，训练会降低噪声相关性，即两个神经元在同一试验中围绕其平均响应的发放率的相关减少或增加。任务训练还会改变持续活动的时间过程和动态。例如，一些神经元的发放率据知会在试验过程中“逐渐增加”或减少，从而在不同时间点动态地编码信息，或者在将信息最佳输入到PFC的模式中。神经元活动的分布模式（图2f中的“表征几何”）可能会发生相当大的变化，而皮层毫米级体素中平均发放率只会发生微妙的变化。随着训练的进行，这些变化与仅被 passively 观察相同刺激的动物相比，变得更加显著。

4.3 PFC生理学和计算

许多关于前额皮层等区域的神经网络模型未能重现超出单一任务试验的延续学习，但通过关键修改以增加过去活动状态的持续影响，可以扩展这种学习能力。将学习的神经解剖学上有趣但尚未探索的机制（例如，通过钙信号传导的持续突触权重、神经调节基调以及PFC内不同、相互连接的区域的贡献）纳入工作记忆回路模型将极大推动对于PFC作为自适应学习和行为中枢的实验-理论理解。例如，兴奋性-抑制性连接平衡了学习的理想网络架构，这仅仅被调节相互作用和电路层次解剖结构的复杂性所放大。在动态系统建模中增加整个大脑连接性的进展已经显示出优势，可以隔离出PFC和其他皮质区域随时间的独特贡献，以及它们在不同神经调节状态下的功能和功能障碍。

4.4 学习的固有网络变化

明显的放电模式变化可能是前额网络中神经元之间突触连接的基础变化的结果，可能还涉及个体神经元的生物物理特性。后者至少可以通过神经元射频自相关性的内在时间尺度间接观察到。这些射频生成的时间尺度可以预测神经元在工作记忆任务中的功能角色，并在经过长时间任务训练后通过整合远程输入而发生改变。一个关键问题是神经元活动的时间尺度如何在行为的长时间整合过程中维持工作记忆表征。通过网络建模可以解析不同神经回路特性的重要性。循环神经网络可以模拟复杂的认知任务，并通过人工网络单元之间连接矩阵的权重变化来模拟新任务的习得，模仿神经元突触机制，并指向突触可塑性的潜在机制。在学习过程中，赋予这些网络生物启发的兴奋性和抑制性连接，使其能够隔离出哪些突触权重随时间对学习的贡献最大，这目前已超出非人类灵长类动物神经元记录的技术能力。循环抑制性到抑制性连接对学习特别关键，因为它们对激励单元在工作记忆延迟中的表征进行门控。跨工作记忆延迟的细胞顺序激活实现了时间灵活性，并能够在几秒内跨越时间连接神经元的时间尺度。展望未来，整合关键生物约束和神经解剖引导的连接（超出传统循环连接的神经网络单元池）将更好地推进特定神经生物学特性对工作记忆、学习和行为灵活性的贡献。

4.5 PFC中学习的环路机制

工作记忆（WM）和长期记忆（LTM）过程双向影响彼此，但是哪些具体的突触和神经回路特性变化构成了这些相互作用呢？通过在啮齿动物模型中研究突触权重和活动变化的独特能力，我们可以揭示学习背后的神经回路构建基块，这些基块可能适用于灵长类动物侧前额皮层。在工作记忆和长期记忆相互作用背后的可塑性变化很可能出现在侧前额皮层的II/III层金字塔细胞的树突枝上。在几项研究中，通过来自内侧颞叶（MTL）或其他区域（包括丘脑）的远程输入传入I层抑制神经元后，皮层后突触权重在学习信号后被加强，这些抑制神经元在I层构建了对II/III层金字塔细胞体的去抑制作用，诱导长时程增强并对特定记忆内容的表征进行门控。这些接收来自I层远程输入的抑制神经元类型在灵长类动物前额皮层中的密度和比例也得到扩展。关键是，这些突触的激活可以诱导从内侧颞叶或其他远程输入中看到的学习效应，这些突触变化依赖于NMDA受体调节。然后，对于循环连接的II/III层金字塔细胞的权重变化和较低激活阈值可以通过网络传播，并通过交叉相关、时序相关塑性甚至同步振荡活动来分发这种效应，留下学习的持续痕迹在“典型”工作记忆回路中（图4）。在前额皮层中招募的这些神经元的数量、分布和组织对于决定中尺度神经影像学在何种情况下能够检测到神经元回路中的工作记忆活动模式至关重要。

图4 长期记忆和工作记忆交互的突触和环路机制

4.6 学习的高级研究

如果学习改变了神经元之间的连接模式，那么随着训练的进行，即使这些连接模式与任务执行无关，相同的刺激很可能会产生不同的响应。这一预测得到了最近实验结果的支持，这些结果揭示了在训练进行时，以与训练前相同方式 passively 呈现刺激会逐渐产生不同的响应。这种方式下，前额皮层神经元反映（或许融合）了内侧颞叶回路中的成对编码原则，即对单个刺激及其对的响应会随着时间增强。类似地，学习执行额外任务也会改变代表先前学习任务信息的活动水平。在人类神经影像学研究中，实验设置和更快的学习速度使研究人员能够探索个体进行数十种认知任务的情况，显示包括前额皮层在内的全脑联合皮层网络参与执行多种任务，并且这些活动模式反映了任务目标和形式之间的共性和差异结构。

因此，在特定时刻学习的各种认知因素似乎主要改变了我们从前额皮层微电极尖端所看到的内容：对于任何给定任务，只有在学会执行之后，对任意变量和抽象规则的表征才有可能出现。至关重要的是要注意，前额皮层代表了大量信息，有时甚至在没有训练和学习经验的情况下也是如此。例如，前额皮层神经元对空间和形状信息具有选择性，并且在出现刺激后会产生持续的放电，即使在不需要记住它们的受试者中，在任何工作记忆任务训练之前。这个结果也与发现一致，即受过训练的受试者的前额皮层神经元代表刺激属性，即使这些属性对任务并不重要，尽管活动水平较低。总的来说，各种学习因素共同塑造了前额皮层，使其具备为学习效果做好准备的神经回路，以发展功能性组织和表征，最好地指导即时行为。

5. 结论

过去十年来，系统、认知和计算神经科学领域的关键进展之一是工作记忆任务中的即时需求与学习和记忆的较长时间窗口之间的相互作用。在本文中，我们提供了一个统一的视角，阐述了灵长类动物前额皮层如何关键地引导适应行为：通过作为一个窗口进入过去，以指导未来行为，基于当前需求。跨时间尺度的记忆系统的划分并不能精确映射在大脑区域上；相反，前额皮层皮质活动受长期记忆的影响，从而使得对熟悉和学习过的刺激和任务实现更大的工作记忆成为可能。尽管人类大脑的神经元数量激增，但进化并没有显著增加工作记忆容量，它仍然受到严重限制，只能容纳少数几个项目，而是在跨时间尺度上的灵活整合，我们称之为前额皮层学习。与其说是相互冲突的方案，不如说是通过几秒、几分钟和几个月的训练和学习来转变活动空间，以促进前额皮层中行为相关的表征和动态。其他中心框架考虑前额皮层回路如何促进强化学习过程和更广泛的灵活行为，我们将这些观点扩展到纳入长期学习和记忆系统的机制。在高层面上，前额皮层功能的主要作用是根据最近和过去的经验实施最适合当前任务需求的行为条件。然而，我们并不主张完全消除记忆系统之间的任何边界，关键差异仍然存在：没有任何训练或学习过程能够使工作记忆容量超出长期记忆的限制范围。就像在19世纪一样，现在也不会出现单一的统一记忆理论。但是，现代实验方法和未来研究必须考虑记忆系统之间的联系，这些联系永远无法完全隔离。这不是一个混淆，而是为我们提供了解决记忆中关键缺失环节的机会，并利用包括纵向采样、多区域记录和跨物种和尺度的平行研究在内的范式。通过同时、持续和相互连接地考虑各种类型记忆及其潜在的回路原则，最大的进步将在为实现我们的目标服务中出现。

参考文献：Timescales of learning in prefrontal cortex.