大模型能够自发形成“人类思维地图”！Nature子刊重磅研究揭示多模态大模型类脑机制-CSDN博客

本文链接：https://blog.csdn.net/bagell/article/details/148543160

大模型≠随机鹦鹉！Nature子刊最新研究证明：

大模型内部存在着类似人类对现实世界概念的理解。

LLM能理解现实世界和各种抽象概念吗？还是仅仅在“鹦鹉学舌”，纯粹依靠统计概率预测下一个token? 长期以来，AI社区对这一问题存在很大的分歧。

有一种猜测是，纯粹基于语言的形式（例如训练语料库中token的条件分布）进行训练的语言模型不会获得任何语义。

相反，它们仅仅是根据从训练数据中收集的表面统计相关性来生成文本，其强大的涌现能力则归因于模型和训练数据的规模。这部分人将LLM称为“随机鹦鹉”。

但现在研究证明，并非如此！

中国科学院自动化研究所与脑科学与智能技术卓越创新中心的联合团队在《Nature Machine Intelligence》发表题为《Human-like object concept representations emerge naturally in multimodal large language models》的研究。

团队通过行为实验与神经影像分析相结合，分析了470万次行为判断数据，首次构建了AI模型的“概念地图”，证实多模态大语言模型（MLLMs）能够自发形成与人类高度相似的物体概念表征系统。

研究逻辑与科学问题：从“机器识别”到“机器理解”

传统AI研究聚焦于物体识别准确率，却鲜少探讨模型是否真正“理解”物体含义。

论文通讯作者何晖光研究员指出：“当前AI能区分猫狗图片，但这种‘识别’与人类‘理解’猫狗的本质区别仍有待揭示。”

团队从认知神经科学经典理论出发，提出三个关键问题：

表征相似性：LLMs的物体表征是否具有与人类相似的低维结构？
语义可解释性：大模型是否发展出可被人类理解的语义维度？
神经对应性：AI表征是否与大脑处理物体的神经活动模式存在映射关系？

为回答这些问题，团队设计了一套融合计算建模、行为实验与脑科学的创新范式。

研究采用认知心理学经典的“三选一异类识别任务”（triplet odd-one-out），要求模型与人类从物体概念三元组*（来自1854种日常概念的任意组合）*中选出最不相似的选项。

通过分析470万次行为判断数据，团队首次构建了AI模型的“概念地图”。

具体来说，本研究突破传统神经网络节点分析范式，首创“行为认知探针”方法：

前排提示，文末有AI大模型CSDN独家资料包哦！

机器行为学实验：将心理学实验范式迁移至AI，通过470万次三选一任务构建选择概率矩阵
核心认知维度提取：稀疏正定相似度嵌入算法从大模型行为数据反推其“心智空间”，避免大规模黑箱神经网络的可解释性难题
跨模态验证：同步对比人类行为数据、脑神经活动与大模型表征，建立三者间的定量映射关系

“我们不是通过解剖AI模型内部的海量神经元来理解它，而是让AI像人类一样做选择题，从而逆向破解它的认知系统。”论文第一作者杜长德解释道。这种方法为研究闭源商业模型（如GPT-4）的认知特性提供了可行路径。

核心发现：AI的“心智维度”与人类殊途同归

核心发现有以下几点。

1、低维嵌入揭示普适认知结构

研究采用稀疏正定相似性嵌入方法，从海量大模型行为数据中提取出66个核心维度。

令人惊讶的是，纯文本训练的ChatGPT-3.5与多模态Gemini模型均展现出稳定的低维表征结构，其预测人类行为选择的准确度分别达到噪声上限的87.1%和85.9%。这暗示不同架构的AI模型可能收敛到相似的认知解决方案。

2、涌现的语义分类能力

在没有显式监督的情况下，模型自发形成了18个高级物体概念类别*（如动物、工具、食物）的聚类（图3）*。

MLLM的分类准确率达78.3%，接近人类的87.1%，显著高于传统视觉模型*（包括监督学习、自监督学习等模型）*。

值得注意的是，模型表现出与人类一致的“生物/非生物”“人造/自然”分类边界，印证了认知神经科学的经典发现。

3、可解释的认知维度

研究为AI模型的“思考维度”赋予语义标签。例如：

语义类别相关的维度：如动物、食物、武器或车辆

感知特征相关的维度：如硬度、价值、厌恶度、温度或纹理

物理成分相关的维度：如木材、陶瓷、金属、其他材料

4、与大脑神经活动的惊人对应

通过分析7T高分辨率fMRI数据（NSD数据集），团队发现MLLM的表征与大脑类别选择区域（如处理面孔的FFA、处理场景的PPA、处理躯体的EBA）的神经活动模式显著相关。

在梭状回面孔区（FFA），MLLM的低维“心智”嵌入预测神经活动的准确度达到人类水平的85%，远超纯文本模型（60%）。

这一发现为“AI与人类共享概念处理机制”提供了直接证据。

5、哪个模型在行为选择模式上更接近人类？

研究还对比了多个模型在行为选择模式上与人类的一致性（Human consistency）。

结果显示，大模型（如ChatGPT-3.5、Gemini_Pro、Qwen2_VL）和多模态模型（如CLIP）在一致性方面表现更优，而传统单模态模型（如 ResNet18、VGG16、AlexNet、GPT2）一致性得分较低。

此外，随着模型性能的提升（如从ChatGPT-3.5到GPT-4），一致性得分显著提高，但仍有一定提升空间，尚未达到理论上限（Noise ceiling）。

总体而言，大模型和多模态模型在模拟人类行为选择模式上更具优势。

6、人类和大模型做决策时所依赖的主要维度有什么不同？

下图展示了人类与LLM及MLLM在决策判断任务中所依赖的关键维度的差异。

通过一系列三元组选择示例，揭示了人类在做决策时更倾向于结合视觉特征和语义信息进行判断，而大模型则倾向依赖于语义标签和抽象概念。

尽管两者在某些选择上趋于一致，但在背后起作用的关键认知维度也存在一些区别：

人类更具灵活性和感知整合能力，而模型则更侧重语言驱动的语义归类。这种对比反映出当前人工智能在模仿人类决策过程中的局限性与进步空间。

本文研究发现具有广阔的应用前景，包括：

类脑智能：寻找机器与人类间的认知结构差异，开发与人类认知维度对齐的AI系统 (NeuroAI)
神经科学：基于大模型的类人“心智维度”探索生物脑实现概念组合与泛化、灵活决策与推理的神经机制（AI for Neuroscience）
脑机接口：利用大模型核心维度表征解码大脑神经信号，构建认知增强型脑机接口系统(AI for BCI)

团队还指出了下一步重点：

拓展至新一代多模态大模型，形成认知基准测试平台，为评估AI的语义理解提供客观标准。正如论文通讯作者何晖光研究员所说：“这项工作不仅是在测试AI的能力，更是在寻找人与机器之间共通的认知语言，探测AI模型的“概念地图”只是第一步，未来需要建立涵盖推理、情感等维度的完整认知评估体系。”
采用更大规模、更加细粒度、层次化的概念集，全面建立大模型“认知图谱”。
开发基于认知对齐的大模型持续微调方法，构建新一代认知增强型大模型。

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战项目来学习。（全套教程文末领取哈）
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型，我这份资料就可以无偿分享给你学习，我国在这方面的相关人才比较紧缺，大模型行业确实也需要更多的有志之士加入进来，我也真心希望帮助大家学好这门技术，如果日后有什么学习上的问题，欢迎找我交流，有技术上面的问题，我是很愿意去帮助大家的！

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述