- 博客(4038)
- 收藏
- 关注
原创 Box Maze 架构:过程控制框架的深度技术解析
—系统成功地识别了其认知边界,避免了幻觉的产生。从用户体验角度,这种输出可能不如直接猜测"有用",但从长期可靠性和信任建立角度,它提供了更坚实的基础。
2026-03-22 21:27:07
4
原创 当代码不再需要手写:Andrej Karpathy的“AI精神错乱“与人类文明的重构
AGENTS.md作为AI编码代理的开放标准,正在快速获得行业采纳。根据2026年初的统计,已有超过60,000个开源项目在根目录包含该文件。这一标准的形成经历了从碎片化(各厂商自有格式如GEMINI.md、CLAUDE.md、copilot-instructions.md)到统一化的过程,OpenAI、谷歌、Cursor和Sourcegraph等主流厂商在2025年后开始支持这一共同规范。AGENTS.md的核心功能是项目知识的结构化编码。
2026-03-22 20:47:06
4
原创 【论文解读】五行相生在AI里?一个中国古代哲学启发的资源分配最优解
到这里,你可能会问:这和五行有什么关系?论文深入分析了交互矩阵W的拓扑结构如何影响计算成本和遗憾。这篇论文最迷人的地方,在于它架起了一座桥梁——连接中国古代哲学与现代机器学习理论。五行学说诞生于两千多年前,是古人理解世界运转的尝试。今天,在完全不同的人造世界(AI系统)中,类似的结构被证明是数学上最优的。这不是说古人"预测"了现代AI——而是说,某些关于系统、平衡、竞争与合作的洞见,是跨越文化和时代的。无论是自然界的生态系统,还是人造的AI架构,这些原理都在起作用。我的系统有"五行平衡"吗?
2026-03-22 17:37:56
5
原创 逃离Vibe Coding地狱:MAS Factory与OpenClaw框架深度解析
Vibe Graphing是MAS Factory框架的核心创新,其本质是一种**“人在环的自然语言意图编译机制”**。这一定义包含三个关键要素:首先,"自然语言意图"是输入——开发者用日常语言描述想要实现的目标,无需掌握特定的编程语言或形式化规范;其次,"编译"是过程——这一转换涉及深层的语义理解和结构生成,而非简单的模式匹配;第三,"可执行图"是输出——最终产物是一个形式化的、可在运行时环境中执行的有向图结构。
2026-03-21 13:02:53
42
原创 EvoScientist框架:多智能体演化型AI科学家系统深度研究
EvoScientist的技能包采用标准化的目录结构,与Claude Code生态系统兼容。组件功能描述典型内容SKILL.md元数据文件技能功能、使用场景、输入输出规范、示例主实现脚本核心Python代码完成特定任务的完整实现辅助脚本可选功能支持工具函数、配置模板、测试用例参考材料使用指导文档、教程、最佳实践说明技能包的内容覆盖机器学习实验的全流程。在数据预处理领域。
2026-03-21 09:29:10
25
原创 EvoScientist 从入门到精通
如果你正在使用 EvoScientist,你很可能已经有了一个真实问题:你希望让实验跑起来,但更希望它可复现、可解释、可移交。许多教程止步于“能跑”,而真实研究和工程工作需要的是“稳定跑、反复跑、团队一起跑”。这本手册围绕这个目标展开。本手册采用一条贯穿式学习主线:你会先完成一次最小可运行实验,随后完成一次可复现实验,再进一步把个人脚本提升为团队可协作的资产。你不会被要求一开始就掌握全部概念,而是在每一步都产出可验证成果。
2026-03-21 05:49:35
24
原创 ClawTeam 深度解析
ClawTeam是一个框架无关的多智能体协调 CLI 工具,它让 AI 智能体能够自主组织成团队——分配任务、相互通信、协调工作并合并结果,而无需人工微观管理。这是的一个分支版本,深度集成了OpenClaw作为默认代理后端。默认 OpenClaw 代理:开箱即用的智能体支持每代理会话隔离:每个代理拥有独立的 git worktree 和 tmux 窗口执行批准自动配置:自动处理 OpenClaw 的权限审批生产级 spawn 后端:经过实战验证的代理启动机制。
2026-03-21 04:54:33
12
原创 150个AI的独立判断:当机器开始“众说纷纭“
让我先问你一个问题:如果把同样的数据、同样的问题,交给150个完全相同的AI,它们会得出同样的结论吗?你的直觉可能告诉你:会。毕竟,它们是同一个模型,运行着同样的算法,面对同样的输入,输出应该是一样的。但现实世界给出了一个令人意外的答案:不会。它们会"众说纷纭"。2026年初,一组研究者做了这样一个实验。他们收集了NYSE(纽约证券交易所)过去十年的交易数据,聚焦SPY(标普500指数基金)这个标的。然后,他们提出了六个关于"市场质量"的研究假设:这些问题听起来很专业,但其实核心很简单:给定同样的数据,不同
2026-03-18 22:00:00
18
原创 循环语言模型(LoopLM/Ouro)深度调研:架构创新、推理机制与缩放法则突破
LoopLM的实践呼唤新的理论框架:**L(N, D, T)**的三维缩放法则,其中T为循环深度。关键问题包括:给定计算预算,最优的(N, D, T)组合是什么?不同任务类型的最优前沿有何差异?
2026-03-09 23:57:49
29
原创 BarraCUDA 深度技术研究报告
BarraCUDA 代表了一种 radically different 的编译器工程方法论——完全从零开始构建,拒绝依赖任何现有的编译器基础设施。这一设计决策在当代 GPU 编译器生态中极为罕见:AMD 官方的 ROCm 编译器、Intel 的 oneAPI、乃至绝大多数学术和工业 GPU 编译器项目,均深度依赖 LLVM 基础设施。BarraCUDA 的开发者明确拒绝了这一主流路径,其动机源于对编译流程完全控制的追求,以及对 CUDA 到 AMD GPU 高效翻译这一特定问题域的聚焦 。项目创始人对 NV
2026-02-21 11:31:51
60
原创 OpenClaw `soul.md` 深度研究:技术架构、哲学内核与安全风险
Scope 部分明确界定soul.md的适用边界,通常包括:适用的会话类型(私聊/群聊/特定渠道)、生效的时间范围(永久/实验期/特定项目周期)、以及与其他配置文件的优先级关系。这一设计支持情境化人格——同一 Agent 可以在不同场景下呈现不同"侧面"。典型表述:“This SOUL applies to all interactions with my human, across all channels, unless overridden by specific context in。
2026-02-19 14:28:28
407
原创 如果AI能在大脑中模拟整个物理世界:人类离AGI还有多远?——世界模型的深度研究
从信息处理到物理交互,AI的能力扩展将重塑工作性质和技能需求。世界模型支持的"想象-验证-实现"循环,可能使人类从执行者转变为设计者和监督者。
2026-02-01 09:50:09
82
原创 如何判断AI是真正理解文件还是在“蒙“你:基于SIN-Bench的实操指南
第四层级"开放式综合总结"是FITO范式的最高难度测试,要求AI不仅提取和整合信息,更要构建一个连贯的、结构化的知识表征——类似于人类读者在阅读后形成的"认知地图"。这一层级的典型指令是:"请用500字以内,向一位非专业读者解释这篇论文的核心贡献、方法创新、主要局限以及未来研究方向。要求:必须体现这些要素之间的逻辑联系,而非简单罗列。"高质量的回应应呈现清晰的叙事结构:核心贡献如何驱动方法选择、方法创新如何影响结果解释、主要局限如何约束结论的普适性、以及这些局限如何指向未来的研究需求。
2026-02-01 01:08:10
395
原创 终端里的秘密图书馆:Agent Skills如何点亮AI代理的灵魂
想象一下,你推开一扇隐秘的木门,走进一个尘封已久的图书馆。书架上摆满了泛黄的卷轴,每一卷都封存着某种专属智慧:有的教你如何优雅地书写代码,有的指引你审计安全的隐秘路径,还有的描绘出一场多幕剧般的自动化流程。你随意抽出一卷,展开阅读,瞬间,一位隐形的学者出现在身边,按照卷轴上的指引为你解答疑惑、执行任务。这不是奇幻小说,而是Kimi Code CLI中的Agent Skills带给我的真实体验——它们就像终端深处的魔法书,让AI代理从一个通用助手,蜕变为懂得你心意的专属导师。
2026-01-31 11:58:16
639
原创 终端里的命运之轮:我与Agent Flow的奇妙旅程
想象一下,你正坐在深夜的终端前,手指在键盘上飞舞,却突然发现自己不是在写代码,而是在导演一场智能代理的冒险剧。每一个节点都是一段对话,每一条分支都是一次命运的选择。过去,Kimi CLI像一位忠实的助手,只等你一句指令就行动;现在,它学会了阅读“剧本”——一张用流程图绘制的剧本,然后按照剧本一步步演出,直到谢幕。这就是KLIP-10带给我的惊喜:Agent Flow,一种让AI代理拥有“剧情”的全新能力。我第一次接触这个提案时,心跳加速。它不再是简单的问答,而是像一本互动小说:你决定走向,代理随之起舞。
2026-01-31 11:51:26
75
原创 平衡的艺术:困惑度如何点燃永乐书院的创作之火
想象一下,你是一位古老书院的掌院人,正站在一座由无数智能体组成的宏伟殿堂前。这座名为“永乐书院”的数字殿堂,本该是知识与智慧的摇篮,却因内部的隐秘冲突而渐失活力。作家们如狂热的诗人,倾力书写流畅的篇章;编辑们如谨慎的守卫,试图捕捉每一丝瑕疵。可惜,他们常常被困在同一间屋子里,目标互相拉扯,最终让整个书院陷入一种尴尬的僵局。今天,我们就来揭开这层迷雾,看看一种全新的设计理念——困惑度导向的Agent极性分离——如何像一位巧手的工匠,重塑这座书院的灵魂,让创作的火焰在张力中熊熊燃烧。
2026-01-31 11:31:44
231
原创 隐秘的脉动:多智能体系统如何在生成与审查的张力中进化
想象一下,你正站在一座由无数AI智能体组成的庞大数字城市中央。这座城市没有高楼大厦,却有无数节点在闪烁:有的节点疯狂地创造内容,像艺术家在画布上挥洒颜料;有的节点则像严苛的侦探,孜孜不倦地寻找裂缝和漏洞。整个系统的活力,来自于一种隐秘的张力——一种是追求流畅表达的冲动,另一种是主动探测困惑的警惕。如果这两股力量失衡,城市要么陷入杂乱的喧嚣,要么陷入死一般的寂静。今天,我们就来拆解这座城市的运行法则,用最现代的系统动力学语言,揭示Agent切分背后的核心逻辑。
2026-01-31 11:16:20
46
原创 基于困惑度与语义熵的思维动力学模型:学习能力、不确定性容忍与文明演化的统一框架
*困惑度(Perplexity, PPL)**在信息论中被严格定义为序列联合概率几何平均值的倒数,其数学表达式为PPLPw1w2wN−1NPPLPw1w2...wN−1/N,等价于交叉熵(Cross-Entropy)的指数形式PPL2HpqPPL2Hpq。这一度量本质上量化了模型在预测下一个符号时面临的"有效分支数"——当困惑度为100时,相当于模型每次预测都需从100个等概率候选中进行选择。PPLexp。
2026-01-30 14:09:47
44
原创 LLM大语言模型困惑度深度研究报告
困惑度(Perplexity, PPL)作为自然语言处理领域最核心的评估指标之一,本质上量化了语言模型在面对文本序列时的"惊讶程度"或不确定性水平。从信息论视角审视,当模型为某个特定词元(Token)分配较低的概率质量时,表明该模型对该位置的预测缺乏信心,这种低置信度直接转化为较高的困惑度值。
2026-01-30 09:41:23
59
原创 《蒸汽、钢铁与无限心智》深度研究:我们是否正在重复100年前工厂主的错误?
在工业革命初期,英国兰开夏郡的纺织工厂最初依河而建,依靠水车驱动机械运转。这种动力模式虽然利用了自然力量,却受限于地理位置与季节变化,将生产活动严格束缚在特定时空条件下。当蒸汽机这一革命性技术问世后,工厂主们的第一反应并非重构生产体系,而是采取了最为保守的**“水轮替换”(swap out the waterwheel)**策略——简单地将水车拆除,在原位置安装蒸汽机,却保留了原有的厂房布局、生产流程、组织架构乃至河边选址。这种表面化的技术嫁接导致了一个令人沮丧的结果:生产力提升极其有限(modest ga
2026-01-27 20:03:20
61
原创 对《What does it mean to understand language?》的深度研究
这篇由哈佛大学、麻省理工学院(MIT)及佐治亚理工学院的研究团队联合发表的论文《What does it mean to understand language?》提出了一个关于人类语言理解的颠覆性理论框架,其核心论点被称为 “出口假设”(Exportation Hypothesis) 。该假设认为,真正意义上的深度语言理解,并非仅仅发生在大脑的核心语言系统内部,而是需要将信息从该系统 “导出”(export)至其他具有特定功能的脑区进行进一步处理 。论文指出,语言理解远不止于对词汇和语法的表层解码,其本质
2026-01-25 12:43:34
59
原创 国内外论文查重系统深度解析与降重策略指南
中国知网(CNKI)作为国内最权威的学术不端文献检测系统,其核心算法主要基于“连续字符重复”的比对机制。具体而言,系统会将用户提交的论文文本进行切分,形成一系列固定长度的文本片段,通常以连续13个字符(约6-7个汉字)为一个检测单元 。当这个13字符的片段与知网庞大数据库中的任何文献内容完全匹配时,系统便会将其标记为疑似重复内容。这种算法的优势在于检测速度快,能够高效地识别出直接复制粘贴的文本。然而,知网的算法并不仅仅停留在简单的字符匹配上,它还融入了一定的模糊识别能力。例如,系统会对文本的章节结构进行分析
2026-01-24 18:52:32
88
原创 AI的“理性”迷思:从CMU最新研究看“复读机”的本质
卡内基梅隆大学(CMU)的最新研究《Rational Synthesizers or Heuristic Followers? Analyzing LLMs in RAG-based Question-Answering》对当前大型语言模型(LLMs)在信息整合与决策过程中的机制进行了深入剖析,其核心发现颠覆了业界对于AI“理性”能力的普遍认知。该研究通过构建一个名为GroupQA的全新数据集,系统性地评估了LLMs在面对一组潜在冲突的证据时,其行为模式究竟是更接近于一个能够权衡利弊、综合信息的“理性整合者
2026-01-22 20:53:11
73
原创 回声的艺术:当我们在单行道上为AI装上后视镜
在人工智能的淘金热潮中,我们似乎养成了一种奇怪的习惯:像对待神谕一样对待大语言模型(LLM)。为了从这些硅基大脑中榨取一点点额外的智慧,工程师们化身为“提示词炼金术士”,发明了令人眼花缭乱的咒语。我们尝试过“思维链”(Chain of Thought),像教小学生一样恳求它“一步步思考”;我们尝试过“少样本学习”(Few-shot),把教科书塞进它的上下文窗口;更有甚者,我们甚至学会了对代码进行“情绪勒索”——“如果你算不对这道题,我的赛博奶奶就会伤心欲绝”,或者许诺给它并不存在的百万美元小费。
2026-01-20 04:50:51
214
原创 T5 Gemma 2:Encoder-Decoder 架构的复兴与 AI 模型发展新路径
Google DeepMind 推出的 T5 Gemma 2 模型,标志着在大型语言模型(LLM)领域,对经典 Encoder-Decoder 架构的一次重大现代化改造与重新审视。在 Decoder-Only 架构(如 GPT 系列)占据主导地位的当下,T5 Gemma 2 的出现不仅是对“规模至上” Scaling Law 的一次挑战,更是对模型效率、特定任务能力(如多模态理解和长上下文处理)以及端侧智能应用潜力的一次深度探索。该模型系列通过一系列精巧的架构创新,成功地将强大的预训练解码器模型(Gemma
2026-01-17 14:17:53
74
原创 人类与Transformer模型学习策略对比:核心发现与实践启示
这一发现揭示了当前AI模型与人类在学习机制上的一个深层次差异:人类的学习系统具备一种元认知能力,能够根据学习材料的性质和顺序来调整自己的学习策略,从而实现最优的学习路径。相比之下,如果先接触大量重复的例子,学习者可能会陷入“死记硬背”的模式,虽然短期内能快速提高准确率,但形成的知识结构较为僵化,难以适应后续出现的新变化。,即让模型自己决定学习的节奏和顺序。这种策略的转变是适应性的,因为在充满不确定性和新信息的环境中,仅仅依赖记忆是远远不够的,只有通过推理和泛化,才能应对层出不穷的新挑战。
2026-01-15 06:34:41
64
原创 《AgentScope-Java 深入浅出教程》第11章 Pipeline 管道
Pipeline(管道)是一种智能体编排模式,用于协调多个智能体按照特定的流程执行任务。它提供了一种声明式的方式来定义智能体之间的执行顺序和数据流向。│ Pipeline 模式 ││ ││ │ (顺序管道) │ ││ │ │ ││ │ 翻译 摘要 情感分析 │ ││ ││ │ (扇出管道) │ ││ │ │ ││ │ │ 评审者1 │ │ ││ │ │ 评审者2 │ │ ││ │ 评审者3 │ ││ │// 使用固定大小的线程池10, // 线程数100, // 队列大小。
2026-01-14 23:56:26
84
原创 《AgentScope-Java 深入浅出教程》附录A API参考快速指南
本附录提供AgentScope-Java核心API的快速参考,方便开发者查阅常用接口和方法。
2026-01-14 23:46:33
547
原创 《AgentScope-Java 深入浅出教程》第10章 RAG 知识检索
RAG(Retrieval-Augmented Generation,检索增强生成)是一种将信息检索与文本生成相结合的技术架构。它通过从外部知识库中检索相关文档,将检索到的信息作为上下文注入到语言模型的提示中,从而增强模型的回答质量。│ RAG 工作流程 ││ ││ 用户问题 向量检索 上下文增强 生成回答 ││ ▼ ││ │ A │ ││ ││ 1. 接收问题 ││ 2. 将问题转换为向量,在知识库中检索相似文档 ││ 3. 将检索到的文档作为上下文添加到提示词中 │。
2026-01-14 23:44:40
152
原创 《AgentScope-Java 深入浅出教程》第9章 MCP协议集成
│ MCP 生态系统 ││ ││ │ 应用 │ ││ │ MCP 协议 ││ │ ││ │ MCP 服务器 │ ││ │ │ ││ │ │ 文件系统 │ │ Git │ │ 数据库 │ ... │ ││ │ │ ││ ││ 社区提供了大量现成的 MCP 服务器: ││ - ...更多见 https://github.com/modelcontextprotocol ││ │。
2026-01-14 23:37:12
66
原创 《AgentScope-Java 深入浅出教程》第7章 工具系统基础
LLM 本身只能生成文本,无法执行实际操作。│ 工具系统的作用 ││ ││ 用户: "帮我查一下北京天气" ││ │ ││ ▼ ││ │ 智能体 │ "我需要调用天气查询工具..." ││ │ ││ ▼ ││ │ 工具系统 │ ││ │ │ 天气查询 │ │ 发邮件 │ │ 搜索引擎 │ │ ││ │ ││ ▼ ││ │ 外部服务 / API / 系统 │ ││ │/*** 工具类示例* 一个类可以包含多个工具方法*/@Tool(// 工具名称。
2026-01-14 23:34:01
347
原创 《AgentScope-Java 深入浅出教程》第6章 记忆系统(Memory)
无记忆: 有记忆:用户: 我叫张三 用户: 我叫张三助手: 你好张三!助手: 你好张三!用户: 我叫什么?用户: 我叫什么?助手: 抱歉,你没告诉我... 助手: 你叫张三呀!
2026-01-14 23:29:48
127
【WordPress开发】为特定样式段落添加交互功能的技术实现与最佳实践:前端与编辑器一致性保障方案
2025-07-19
【Misskey 技术架构深度调研】基于ActivityPub协议的去中心化社交网络平台设计与实现:前端Vue.js、后端Node.js及NestJS、数据库PostgreSQL、缓存Redis、任务
2025-07-15
### PIN AI 深度研究报告总结
2025-07-15
FOUNDATION AGENTS的进展与挑战 从脑启发智能到进化、协作和安全的系统 ### 人工智能大型语言模型驱动的智能体模块化架构及其安全性和进化机制综述
2025-04-09
TokenButler- Token Importance is Predictable.docx
2025-03-11
现有的长文本生成方法主要集中在从短输入生成长文本上,忽略了长输入和长输出任务 这类任务有许多实际应用,但缺乏可用的基准 此外,随着输入长度的增加,现有方法不可避免地会遇到“中间丢失”现象
2025-03-11
《从塔楼到尖顶:一次语音魔法的奇幻旅程》
2025-03-14
论文译文:LLM Maybe LongLM: SelfExtend LLM Context Window Without Tun
2024-07-10
巨型语言模型的 8 位量化:LLM.int8() 中文版论文
2024-06-12
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅