罗西的思考-CSDN博客

原创探秘Transformer系列之文章列表 --- 更新至第 29 篇

从零开始解析Transformer，目标是：(1) 解析Transformer如何运作，以及为何如此运作，让新同学可以入门；(2) 力争融入一些比较新的或者有特色的论文或者理念，让老鸟也可以有所收获。

2025-03-23 00:16:06 613

原创新书出版：《分布式机器学习——系统、工程与实战》

当然，很多时候我们只有源码，那么就只能从源码中根据细节来探寻，重建论文作者的思路，提炼其精华，争取和作者达到一个跨越空间和时间的震荡和共鸣。其实我也没有很好的学习方法，可能因为我比较喜欢钻研技术，如果某一个技术点没有想明白，我就会围绕这个点进行深入挖掘，而往往为了弄明白一个知识点，就会研究其他相关知识点，这样从一个点很容易延申到一条线，进而扩展到一个面，最后形成一张网，就构建了自己的一个小小的知识体系。

2023-07-21 23:56:05 694 1

原创 AI Agent 框架探秘：拆解 OpenHands（3）--- 启动

这些提示词中融入了特定领域的知识准则与操作规范，例如，与Git相关的Microagent，其提示词会包含Git操作的核心技巧与最佳实践，能够引导模型更精确地处理与Git相关的任务，成为主代理应对细分场景的“得力助手”。run_controller 作为 OpenHands 后端单个会话的核心入口协程，核心职责是依据预设配置启动运行时环境、智能体及对应控制器，搭建起从接收用户指令到多步骤执行任务，再到最终将会话状态持久化存储的完整处理链路。事件回调函数会根据当前的事件进行状态机的状态转移。

2026-01-27 20:57:26 530

原创 FastDDS 源码解析（十八）EDP阶段发送心跳heartbeat

上一篇我们讲到收到pdp消息之后的EDP匹配部分，其中远端的EDP writer匹配已经讲完，这一篇我们介绍一下远端的EDP reader匹配到本地的StatefulWriter。匹配完成后writer将会发送心跳heartbeat。

2026-01-22 21:33:13 810

原创 AI Agent 框架探秘：拆解 OpenHands（2）--- CodeAct论文

综上，ReAct 作为早期 Agent 的核心范式，在单一任务、短任务链、弱约束的场景中依然有价值，但作为企业级、跨域、强约束 Agent 系统的基础架构时，其局限性已经是结构性的，而不是简单通过加强提示词或增加工具种类就能弥补的问题。CodeAct 的核心洞见在于，与其让智能体（Agent）扮演 “文书” 角色生成静态指令，不如使其成为 “程序员”—— 直接生成可执行的 Python 代码，由解释器一次性执行，从而将预训练阶段积累的编程知识转化为灵活的即席行动能力。

2026-01-21 21:25:13 899

原创 FastDDS 源码解析（十七）处理PDP消息——EDP匹配

继续转载好友文章。

2026-01-20 22:35:31 998

原创 AI Agent框架探秘：拆解 OpenHands（1）--- 核心理念

掌握Agent的底层逻辑，不仅是熟练使用的基础，更是设计、评估和扩展的关键。对于产品经理、人工智能工程师和技术决策者来说，只有深入理解Agent的技术蓝图，才能在AI应用的落地过程中做出精准布局，抓住未来的机遇。构建一个实用的AI Agent需要哪些核心技术模块的支持？这些核心模块如何协同工作，形成完整的任务执行闭环？AI Agent系统在落地过程中会面临哪些关键挑战，OpenHands如何解决这些工程化难题？我们希望通过这一场深入的“拆解”之旅，超越表层功能的演示，直接触及其架构的基石。

2026-01-19 21:10:27 653

原创【大数据 & AI】Flink Agents 源码解读 --- (7) --- AgentsExecutionEnvironment

AgentsExecutionEnvironment 的代码如下。本地执行环境实现集成自 AgentExecutionEnvrionment，为本地测试和开发提供执行环境不依赖 Flink 集群，可以在本地环境中运行和调试代理数据源支持通过from_list方法支持从列表数据源读取输入数据。

2026-01-15 21:57:40 618

原创【大数据 & AI】Flink Agents 源码解读 --- (6) --- ActionTask

PythonActionTask 对应一个 Python 函数（更准确地说是一个 PythonFunction 对象），这个函数是在创建 Action 时定义的，存储在 action.getExec() 中。但PythonActionTask 不仅仅是简单的函数封装，而是使其能够在 Flink Agents 框架中正确执行，并支持框架所需的高级特性。复杂逻辑：PythonActionTask 不仅仅是执行函数，还负责处理复杂的交互逻辑执行环境管理：为函数提供合适的执行上下文。

2026-01-12 20:55:56 872

原创【大数据 & AI】Flink Agents 源码解读 --- (5) --- ActionExecutionOperator

ActionExecutionOperator 是整个Flink Agent 系统的执行引擎，它连接了 Flink 流处理框架和 Agent 逻辑，协调各种组件完成了 Agent 定义的动作执行。事件处理：接收来自上游的数据，包装成InputEvent动作执行：根据Agent定义的动作规则，触发相应的处理逻辑状态管理：维护短期记忆，检查点状态等异步支持：处理需要异步执行的任务Python/Java交互操作：协调组件间的交互输出产生：将最终结果作为OutputEvent发送到下游。

2026-01-08 20:42:23 594

原创【大数据 & AI】Flink Agents 源码解读 --- (4) --- AgentPlan

"""从用户自定义 Agent 编译得到的智能体执行计划核心作用：封装 Agent 运行所需的动作、事件映射、资源、配置等核心信息"""# 动作名称到动作对象的映射# 事件类型（字符串格式）到监听该事件的动作名称列表的映射# 资源提供者映射：第一层是资源类型，第二层是资源名称，值为对应资源提供者# Agent 的全局配置# 私有缓存：已创建的资源实例（避免重复初始化），键为 (资源类型, 资源名称)

2026-01-05 20:55:20 790

原创【大数据 & AI】Flink Agents 源码解读 --- (3) --- Agent

ReActAgent 为标准的基于 LLM 的推理任务提供了现成的解决方案，而 Workflow Style Agent 为复杂的自定义代理实现提供了最大的灵活性。有人戏称：拉投资用 Agent 讲故事，做业务踏踏实实用 Workflow。这句玩笑背后折射出现实的考量：Workflow 胜在确定性，而 Agent 胜在上限。ReActAgent 的定义如下。

2025-12-31 19:19:12 642

原创【大数据 & AI】Flink Agents 源码解读 --- (2) --- 核心架构

Flink Agents 框架的核心是“事件驱动 + 状态隔离 + 多语言协作”：通过 Agent/AgentPlan 实现业务逻辑的声明式定义，借助 Flink 原生的分布式、高并发能力实现可靠执行，同时支持 Python 生态的工具 / 模型集成，兼顾了开发灵活性与运行时效率，适用于复杂 AI 代理任务的分布式部署与执行。具体而言，Flink Agents 的组件是对原生 Flink 组件在 “Agent 业务场景” 下的语义化封装，而非全新发明。

2025-12-29 20:27:08 957

原创 FastDDS 源码解析（十六）处理PDP消息——PDP匹配

上一篇我们介绍了收到一条pdp消息后的一部分前期的处理逻辑。这一篇我们介绍这个pdp消息所携带的Participant的信息和PDP匹配的过程。

2025-12-25 22:20:54 938

原创【大数据 & AI】Flink Agents 源码解读 --- (1) --- 设计

Flink Agents 是Apache Flink社区最近推出的一个全新的项目，一个专门为事件驱动场景设计的智能体框架。该项目聚焦事件驱动型AI智能体，结合Flink的实时处理能力，推动AI在工业场景中的工程化落地，涵盖智能运维、直播分析等典型应用，展现其在AI发展第四层次——智能体AI中的重要意义。本系列从源码入手，深入解析 / 反推 Flink Agents项目的架构设计。因为属于反推，肯定存在各种错误，还请大家不吝指出。Flink Agents 的核心目标是。

2025-12-24 20:23:32 1015

原创 FastDDS 源码解析（十五）接收PDP消息（下）

上一篇我们介绍了一条pdp消息的大概内容，和接收到pdp消息之后到分发给statelessreader处理的大概过程，这一篇我们介绍一下statelessreader如何接收这条消息。

2025-12-23 22:39:33 738

原创【Agent】MemOS 源码笔记---(7)---MemScheduler 细节

记忆调度就像大脑的注意力机制，动态决定在合适的时刻调用合适的记忆。在 MemOS 中，记忆调度（Memory Scheduling）通过对【不同使用效率（参数>激活>工作>其他明文）的记忆】的相互调度，让模型能更高效、准确地获取用户所需的记忆。在对话和任务进行时，通过预测用户后续对话所需记忆并提前调入高效率记忆类型如激活记忆工作记忆，加速推理链路。

2025-12-22 20:19:46 631

原创【Agent】MemOS 源码笔记---(6)---MemScheduler -- 总体

记忆调度就像大脑的注意力机制，动态决定在合适的时刻调用合适的记忆。在 MemOS 中，记忆调度（Memory Scheduling）通过对【不同使用效率（参数>激活>工作>其他明文）的记忆】的相互调度，让模型能更高效、准确地获取用户所需的记忆。在对话和任务进行时，通过预测用户后续对话所需记忆并提前调入高效率记忆类型如激活记忆工作记忆，加速推理链路。

2025-12-18 21:23:58 604

原创【Agent】MemOS 源码笔记---(5)---记忆分类

大模型之所以“忘事”，根本在于我们对“无状态模型”里“上下文窗口”的误解。很多人把它当成一只大箩筐，认为装得越多越好；然而，事实上，上下文窗口更像一块容量有限的工作记忆。硬塞太多信息，只会同时带来如下麻烦：关键内容被噪声淹没，模型抓不住重点，上下文越长，费用和延迟也越高。这不是模型偷懒，而是 Transformer 架构的先天特性。每一次调用都像重新开机：没有长期记忆，上下文一旦过长，注意力就被冗余信息扯散，于是出现遗忘、跑题、速度下降。为了补上这块短板，人们在记忆上大动手脚。

2025-12-15 21:31:50 1052

原创【Agent】MemOS 源码笔记---(4)---KV Cache

MemOS中的KV Cache机制通过预计算和存储语义稳定的背景信息（如FAQ、对话历史）为键值对张量(KVCacheItem)，实现了高效记忆复用。该系统将明文记忆转换为KV格式表示，避免重复编码，显著降低推理延迟。KV Cache与TreeTextMemory协同工作，由MemOS统一管理，支持快速响应和高吞吐量的应用场景。相比传统文本记忆方式，KV Cache通过直接注入注意力机制，减少了冗余计算，优化了首次token生成时间(TTFT)，特别适合多轮对话和检索增强生成任务。

2025-12-10 21:24:43 1032

原创【Agent】MemOS 源码笔记---(3)---搜索

TreeTextMemory 提供了一个完整的记忆管理系统，能存储、组织、检索和维护各种类型的文本记忆、适用需要复杂记忆管理的AI系统。这是一个基于图的、树形明文记忆，支持以结构化方式组织、关联并检索记忆，同时保留丰富的上下文信息与良好的可解释性。我们可以通过这个TreeTextMemory 对象与庞大的知识库进行交互，为AI赋予专业的领域记忆。当前使用Neo4j作为后端，未来计划支持更多图数据库。

2025-12-08 20:27:51 1030

原创【Agent】MemOS 源码笔记---(2)---TreeTextMemory

本文介绍了TreeTextMemory记忆管理系统的核心概念与架构。该系统基于图数据库(Neo4j)构建，采用树形结构组织文本记忆，支持多层级关联和语义搜索。系统包含LLM处理模块、Embedding模型、图数据库存储、重排序器等组件，通过MemoryManager协调记忆生命周期管理。每个记忆节点包含文本内容、元数据(类型、状态、来源等)和向量嵌入，支持复杂的知识组织和多跳推理。该系统适用于需要结构化记忆和可解释关系的AI应用场景。

2025-12-01 21:17:21 1005

原创 FastDDS 源码解析（十四）接收PDP消息（上）

本文解析了FastDDS中PDP消息的接收过程。通过Wireshark抓包分析PDP消息结构，包括消息头、子消息和具体内容。PDP消息包含了参与者协议版本、GUID、地址信息、超时时间等关键字段。在接收端，UDPTransport通过Socket接收消息，由MessageReceiver处理并分发给对应的RTPSReader。对于PDP消息，最终会调用process_data_message_without_security函数进行处理。文章还展示了相关类图和时序图，说明PDP消息如何在本地和远端参与者之间

2025-11-23 11:22:43 637

原创 FastDDS 源码解析（十三）发送第一条PDP消息---跨进程发送

本文解析了FastDDS中跨进程通信的数据共享(datasharing)机制实现原理。作者首先介绍了FastDDS使用共享内存实现跨进程Zero-Copy传输的基本概念，指出其本质是以CPU资源换取内存空间节省。然后分析了该机制的优缺点，认为在嵌入式场景中性价比不高，建议采用单一FastDDS节点加传统IPC的架构替代。文章详细解读了接收端初始化流程，包括创建共享内存区域、通知机制和监听线程的启动过程。最后说明了DataSharing的三种配置模式（ON/OFF/AUTO）及其应用场景。整体来看，作者认为F

2025-11-22 11:10:11 832

原创 FastDDS 源码解析（十二）发送第一条PDP消息（下）---异步发送

FlowController看名字就是大概什么意思，就是发送流的控制器。FlowControllerImpl 是一个泛型类模版。里面有两个类型参数PublishMode, SampleSchedulingPublishMode负责FlowControllerImpl 同步异步发送逻辑SampleScheduling负责FlowControllerImpl在异步发送过程中的调度策略。

2025-11-21 08:53:37 609

原创 FastDDS 源码解析（十一）发送第一条PDP消息（中）

FastDDS PDP消息发送流程解析本文分析了FastDDS中发送第一条PDP消息的中间过程，重点介绍了FlowControllerImpl的同步发送机制。核心内容： FlowControllerImpl是一个模板类，通过PublishMode控制同步/异步发送策略，SampleScheduling控制异步调度策略对于PDP阶段的statelesswriter使用FlowControllerPureSyncPublishMode，仅支持同步发送同步发送流程：获取writer的LocatorSel

2025-11-20 20:27:08 614

原创【Agent】MemOS 源码笔记---(1)--基本概念

MemOS（Memory Operating System）是一种专为AI系统设计的记忆操作系统，旨在解决大型语言模型在记忆管理上的局限性。它将记忆提升为系统级资源，通过统一格式、生命周期和调度机制，实现自动存取、版本控制和分层管理。MemOS支持三种记忆类型：结构化记忆（明文）、激活记忆（运行时缓存）和参数化记忆（动态技能注入）。该系统能够实现个性化对话、团队知识库共享和跨会话任务连续性，显著提升AI的长期记忆能力和适应性。MemOS的开源架构结合了图数据库和向量搜索技术，为开发者提供了高效管理记忆的解决

2025-11-19 20:25:20 1473

原创车载消息中间件FastDDS 源码解析（十）发送第一条PDP消息（上）

本文解析了FastDDS中RTPSParticipantImpl启用PDP发现机制的过程。当调用RTPSParticipantImpl::enable()时，主要完成两个核心操作：一是通过BuiltinProtocols::enable()启动PDP协议（包括初始化两个定时事件lease_duration_event和resend_participant_info_event_，分别用于检查远程参与者的存活性及周期性发送PDP消息）；二是将MessageReceiver与ReceiverResource关联

2025-11-18 20:09:07 667

原创车载消息中间件FastDDS 源码解析（九）Message

这篇文章主要介绍了RTPS（Real-Time Publish-Subscribe）消息中间件FastDDS中的Message结构。RTPS消息由消息头、可选的HeaderExtention和子消息(Submessage)三部分组成。消息头包含协议版本、供应商ID等信息，而子消息分为Entity子消息和解释器子消息两类，分别用于数据交换和状态修改。文章详细说明了各种子消息(如AckNack、Data、Heartbeat等)的结构和功能，并通过Wireshark抓包实例展示了RTPS消息的实际组成。这些消息机

2025-11-17 20:02:28 920

原创车载消息中间件FastDDS 源码解析（八）TimedEvent

本文分析了FastDDS中的TimedEvent机制，该机制用于处理周期性事件，如心跳发送等。主要介绍了： TimedEvent通过ResourceEvent进行管理，ResourceEvent由后台线程轮询处理TimedEvent事件。 TimedEvent的使用方式：初始化时传入ResourceEvent、回调函数和时间周期可通过update_interval()更新周期时间使用restart_timer()启动定时器使用cancel_timer()取消定时事件源码解析重点： TimedEve

2025-11-16 10:05:04 908

原创车载消息中间件FastDDS 源码解析（七）BuiltinProtocols（下）WLP&TypeLookupManager

WLP协议简介 WLP(Writer Liveliness Protocol)是一种默认不配置的可选协议，主要用于管理writer的存活状态。该协议包含StatefulWriter(RTPSMsgWriter)和StatefulReader(RTPSMsgReader)两个端点，功能类似于socket心跳机制，但更为复杂。 WLP支持三种存活策略： AUTOMATIC_LIVELINESS_QOS：由基础设施自动发送存活消息 MANUAL_BY_PARTICIPANT_LIVELINESS_QOS：由Par

2025-11-15 08:03:04 967

原创车载消息中间件FastDDS 源码解析（六）BuiltinProtocols（中）EDP

本文解析了FastDDS中的EDP（端点发现协议）初始化过程。EDP负责在PDP（参与者发现协议）之后进行Writer和Reader的互相发现。EDP默认使用simple发现协议，也可配置为static协议。文章详细介绍了EDP的4个内置端点（2对Writer/Reader）及其功能，并通过时序图展示了EDP初始化的完整流程，包括创建StatefulWriter和StatefulReader等关键步骤。源码分析部分重点讲解了createSEDPEndpoints()方法如何创建端点及其相关属性设置。

2025-11-14 07:00:13 799

原创【智能硬件】AI 眼镜论文笔记

智能眼镜研究进展：从被动响应到主动服务近期两篇智能眼镜相关论文展示了AI助手的创新发展方向。《AI for Service》提出主动服务范式Alpha-Service框架，通过轻/重量级模型协同、记忆单元等实现个性化预测性服务；《EgoLife》则聚焦长期生活记忆，构建包含300小时第一人称视频的EgoLife数据集和EgoButler系统，支持7天跨度的生活问答。两研究共同突破传统AI的被动响应模式，在实时性处理、长期记忆建模和隐私保护方面面临持续挑战，为下一代可穿戴智能设备奠定理论基础。

2025-11-13 22:04:40 979

原创车载消息中间件FastDDS 源码解析（五）BuiltinProtocols（上）PDP

文章摘要本文深入解析了FastDDS内置协议BuiltinProtocols的初始化过程，重点介绍了PDP（Participant Discovery Protocol）的初始化机制。BuiltinProtocols管理四个核心协议组件：PDP（负责Participant发现）、EDP（端点发现协议）、WLP（Writer存活状态协议）和TypeLookupManager（数据类型管理）。初始化流程分为： PDP初始化：根据不同协议类型创建对应的PDPSimple/PDPClient/PDPServer

2025-11-12 07:14:59 891

原创【Agent】生成式隐式记忆 MemGen 源码解读

本文介绍了一种新型动态生成式记忆框架MemGen，由记忆触发器(Memory Trigger)和记忆编织器(Memory Weaver)两个轻量级模块协同工作。该系统突破了传统静态记忆检索的局限，通过强化学习训练的触发器动态判断记忆插入时机，编织器生成针对性潜在记忆，实现推理过程中记忆的动态增强。核心创新在于模块化协同设计、动态记忆增强机制以及精度与效率优化，使智能体能够在任务执行中自生成、使用记忆，无需依赖静态检索或参数化存储。实验表明，该方法能有效提升模型性能，同时保持参数高效学习和计算效率。

2025-11-10 19:52:09 927

Word2vec-OpenSourceReading-master.zip

空空如也