导语
日常生活工作中,我们不断搜寻信息以做出更好的决策。尤其是在当今社会,当更多信息触手可及时,我们选择收集的信息决定了决策的质量。决策神经科学长期采用实验方法,实验中决策者可以使用的信息完全由研究者控制,导致对信息搜寻的神经机制理解较少。
虽然信息搜寻在探索-利用权衡的背景下已经研究很久,但近期的研究扩大了范围,以一种与其他决策过程截然不同的方式研究信息搜寻的机制。这些研究在过去几年中积累的证据和结论提出了一种可能性:信息搜寻是由奖励系统所传递的信息的主观价值所驱动的。这篇文章回顾了最近研究的发现,强调了不同文献之间的概念和实验联系,并讨论了未来研究方向,更全面地理解个体在基于价值的决策中搜寻信息的方式和机制。
研究领域:信息搜寻,决策,好奇心,奖励系统,探索-利用权衡
来源:集智俱乐部
作者:尹爱华
论文题目:Neural mechanisms of information seeking
论文期刊:Neuron
论文地址:
https://www.cell.com/neuron/abstract/S0896-6273(24)00246-0
想象你是一个咖啡爱好者,你会如何选择咖啡店?如果你现在在居住的城市,你可能已经有了一个多年光顾的咖啡店,因此可能不需要APP的在线评论。然而,你仍然可能以不同的方式去搜寻信息:可能会不时地访问其他店铺,看看这些店铺的咖啡质量是否有所提高;当城市中开设新的咖啡店时,可能会尝试一下,看看这些新店的咖啡是否比当前的最爱更好。如果你出差去了一个新的城市,过去的经验可能不再有用,你需要重新累计对不同咖啡店的体验,你会更加积极地去探索,在不同咖啡店消费,直到找到新的最爱,并开始定期消费;作为一个咖啡爱好者,你可能会对咖啡文化保持好奇,你会阅读世界各地咖啡店的博客和社交媒体帖子。上面这个例子时我们无数日常生活决策的缩影,可以看出信息搜寻具有多样性。人们搜寻信息以解决具体决策问题或出于好奇心。
图1 跨决策上下文的信息搜寻
单个信息搜寻的神经机制
图2 概率性奖励结果的单次先验信息
为了阐明信息搜寻的神经认知机制,一些研究聚焦于与未来结果相关的单个信息的神经活动。这些研究的实验范式中,参与者面对的是非确定性的与概率有关的奖励结果,例如金钱或果汁。参与者首先被呈现关于随机结果的线索(例如,果汁奖励的可能数量及其概率),然后选择是否一定风险获取新的信息。尽管现实世界中的某些决策问题涉及多个先验信息,但聚焦于单个信息有助于通过实验描述潜在的神经过程 。
图3 好奇心研究的实验范式
另一类文献关注好奇心的神经基础。尽管好奇心直观上会驱动信息搜寻行为,但相关研究更多集中于好奇心的心理感受,通常是通过诸如小测验或魔术之类的刺激产生的。研究显示,尽管这一领域的研究还处于初期阶段,但一些研究一致地证明了多巴胺奖励系统参与信息搜寻行为。
时间段内的信息搜寻机制
决策者经常需要在一段时间内收集多条信息来做出决策。目前少尝试通过实验探究单次信息搜寻的神经认知机制如何泛化到时间段内的信息搜寻,现有的研究主要集中在两类决策问题上:强化学习中的探索-利用权衡和证据积累的停止。
图4 探索-利用权衡研究
强化学习主体通常基于过去的行动和奖励的关联性来选择奖励最大化的行动,但这种方法在动态环境中可能导致次优行为。多臂老虎机任务经常被用来研究这种权衡。
图5 证据积累的停止决策研究:背外侧前额叶皮层(DLPFC)表征了顺序信息搜寻情境中的主观价值信息
证据积累的停止决策研究探讨了人类如何决定何时停止积累证据以做出决策,文章介绍了一些经典行为范式,并指出背侧前额叶皮层(DLPFC)在主观信息价值表征中的作用,即DLPFC追踪基于当前决策证据的信息价值变化。
未来方向
尽管信息寻求的神经基础的实验研究仍处于初期阶段,但已经取得了显著进展。不同实验方法之间存在的一些关键差异,需要在未来的研究中加以解决。例如,虽然有证据表明奖励系统(VTA/SN、VS、VMPFC)在一次性信息寻求中的作用,但其在多次信息寻求中的作用证据较少。此外,是否有不同系统参与不同类型的信息寻求?奖励系统在不同情境下对信息价值的编码是否普遍适用?这些问题需要进一步研究。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)大脑研究计划,构建互联网(城市)大脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。每日推荐范围未来科技发展趋势的学习型文章。目前线上平台已收藏上千篇精华前沿科技文章和报告。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”