自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2151)
  • 收藏
  • 关注

原创 9个提升Python代码生产质量的第三方库

本文介绍9个被资深工程师广泛使用却常被忽视的Python库:glom(嵌套数据声明式处理)、boltons(标准库功能补全)、beartype(高性能运行时类型检查)、result(显式错误处理)、whenever(防时区bug的现代时间库)、pyinstrument(人类可读性能分析)、dirty-equals(智能测试断言)、stamina(可观测重试)、pyfunctional(链式数据管道)。均经生产验证,开箱即用。

2026-03-21 20:27:34 287

原创 Claude Code 命令体系解析:三种类型、七大分类、50+ 命令

本文全面解析Claude Code全部50+命令:涵盖CLI标志、斜杠指令、键盘快捷键及未公开隐藏功能,分7大模块详解核心10命令(如/init、/compact)、进阶技巧(/btw、/plan)、生产工作流等,助你告别盲区,释放全部效能。

2026-03-20 21:54:54 490

原创 理解 Agent 记忆:从无状态模型到持久化记忆架构

大语言模型本质无状态,对话历史无法自动留存。Agent需长期记忆支撑连续性任务,但简单堆砌上下文不可行。本文系统阐释Agent记忆的四层架构(工作/情景/语义/程序记忆),及其写入、检索与遗忘机制,并对比Mem0、Letta等主流方案,揭示记忆正成为AI Agent技术栈中独立、标准的关键基础设施。

2026-03-19 20:14:54 326

原创 CRAG 架构解析:如何在生成器前修正错误检索结果

CRAG是一种新型RAG框架,直面检索错误问题:引入轻量级评估器,对检索文档打分并按置信度分流——高分则精炼本地文档(句子级过滤重组),低分则转向网络搜索,中等分则双源协同。从架构上杜绝无关内容污染生成器,显著提升答案准确性与鲁棒性。

2026-03-18 21:13:47 319

原创 高级 RAG 技术:查询转换与查询分解

RAG准确性受限于查询质量,易因表述模糊导致检索偏差。主流优化方向为查询转换(如Fan-Out并行检索、RRF重排、HyDE假设文档嵌入)与查询分解(高抽象后退提示、低抽象思维链检索),二者常协同提升召回率与答案质量。

2026-03-17 22:34:16 422

原创 构建生产级 AI Agent 系统的4大主流技术:反思、工具、规划与多智能体协作

本文深入解析Agentic AI四大核心设计模式:Reflection(自我反思)、Tool Use(工具调用)、Planning(任务规划)与Multi-Agent协作。它们共同赋予AI思考、行动、校验与协同能力,突破单轮问答局限,构建真正可落地的自主智能系统。

2026-03-16 21:15:40 405

原创 BookRAG:面向层级文档的树-图融合RAG框架

BookRAG是专为书籍类层级文档设计的新型RAG框架,首创“树+图+链接+Agent”四元结构:构建融合版面层级树与知识图谱的BookIndex,通过GT-Link双向映射实现结构与语义统一;引入信息觅食启发的Agent,动态规划检索路径,支持单跳、多跳及全局聚合查询,在精度、覆盖率与效率上显著优于传统文本/版面优先方法。

2026-03-15 20:11:50 702

原创 多智能体系统的三种编排模式:Supervisor、Pipeline 与 Swarm

2026年,多智能体系统成主流:单智能体易陷上下文污染、角色混乱与故障扩散;而Supervisor、Pipeline、Swarm三类编排模式,配合结构化通信、按能力拆分、置信度验证与全链路Tracing,可构建更可靠、可控、可扩展的AI协作系统。

2026-03-14 21:54:44 438

原创 更大的上下文窗口为什么让RAG变得更重要而非更多余

一旦模型能读完所有内容检索增强生成(RAG)就没有存在的必要了,开发者只需要把整个代码库或者多年的聊天记录塞进 prompt,让模型自行处理,所以AI行业花了好几年追逐更大的上下文窗口:4K → 32K → 128K → 1M tokens。但是真正在生产环境里这么做的时候就出了问题,因为答案变差了。在不少实际系统中,更大的上下文窗口反而拖累了模型表现。

2026-03-13 21:54:27 616

原创 LangGraph vs Semantic Kernel:状态图与内核插件的两条技术路线对比

本文对比2026年最新版LangGraph(v1.0)与Semantic Kernel(v1.28.1),澄清过时认知:LangGraph已成为LangChain执行引擎,支持持久化状态机;SK则原生集成MCP协议,定位AI中间件。二者架构迥异——图编排vs插件组合,运行时托管状态vs开发者自主管理。附代码实操与选型指南。

2026-03-12 21:23:25 466

原创 基于网格搜索与分段回归的时间序列变化点检测方法

本文介绍一种基于网格搜索与分段回归的趋势变化点自动检测方法,结合BIC等惩罚准则平衡拟合优度与模型复杂度,并通过最小分段长度、边缘缓冲等约束提升鲁棒性。支持R/Python实现及Streamlit在线体验,适用于中低噪声、趋势主导的时间序列分析。

2026-03-11 20:58:10 522

原创 Python标准库里藏着的7个代码简化利器

本文揭秘7个高阶Python技巧:生成器实现惰性求值、defaultdict简化计数、Pathlib优雅操作文件、partial定制函数、itertools扁平化循环、type动态创建类、装饰器统一横切逻辑。它们不教语法,而授架构思维——让代码更简、更稳、更易维护。

2026-03-10 20:46:24 413

原创 LangGraph RemoteGraph:本地图与远程图的组合机制解析

本文介绍基于LangGraph RemoteGraph构建的循环数学引擎:本地编排器(顺序/并行两种模式)调用远程图服务,实现随机运算与数字生成;通过条件路由、中断机制、线程级认证及多层错误处理,展示清晰职责分离的分布式AI Agent架构。

2026-03-09 20:47:21 468

原创 MIT论文解读:LLM 会被自身历史回复拖累 ,上下文污染会导致多轮对话质量衰减

MIT 2026年重磅论文揭示:AI多轮对话中,保留自身历史回复反而导致“上下文污染”,引发幻觉累积与质量滑坡。实验证明,移除AI过往回复可缩减上下文达10倍,70%轮次质量不变。这挑战了行业默认设计,呼吁从“堆叠历史”转向“智能省略”。

2026-03-08 21:38:47 526

原创 AutoGen 架构演进全梳理:从 v0.4 到 Microsoft Agent Framework

Microsoft AutoGen(2023–2025)是开创性多智能体开源框架,以“群聊式协作”替代单Prompt链,支持智能体对话、工具调用、代码执行与人工介入。v0.4达技术巅峰,后并入Microsoft Agent Framework(MAF)。其核心范式——LLM专家团队协同——已成行业标

2026-03-07 21:46:20 1032

原创 Energy Distance:度量两个多元分布差异的统计方法

当训练集与测试集分布不一致(数据漂移)时,模型性能可能显著下降。Energy Distance 是一种基于欧氏距离的统计量,可量化两个多元分布的整体差异——值为0表示分布相同,越大差异越显著。它能捕捉变量间联合关系变化,优于单变量检验,常配合置换检验进行统计推断。

2026-03-06 20:53:02 448

原创 大模型训练的硬件基础:GPU内存层级、分块与并行策略

本文深入解析GPU加速大模型训练的核心原理与五大优化技巧:低精度计算、算子融合、重计算、内存合并访问与分块,进而详解FlashAttention的在线softmax实现;并系统对比数据并行(含ZeRO各阶段)、流水线并行与张量并行等多级并行策略,揭示如何突破内存与带宽瓶颈,高效扩展至万卡规模。

2026-03-05 20:49:38 708

原创 贝叶斯公式推导:从联合概率的对称性看条件反转

本文以双盒取球为例,直观讲解概率基础:从简单概率(P(A)=1/2)出发,引入条件概率(P(R|A)=3/4),再自然导出贝叶斯定理(P(A|R)=P(R|A)P(A)/P(R))。全程避免复杂数学,强调“全集切分—视角转换”这一核心思想,让逆向推理清晰可感。

2026-03-04 19:38:09 459

原创 KV Cache管理架构演进:从连续分配到统一混合内存架构

本文系统梳理KV Cache管理演进的5个时代(从无到统一内存架构),剖析vLLM、SGLang、TensorRT-LLM等框架在各阶段的技术取舍与实践效果,涵盖连续缓存、PagedAttention、异构/分布式/统一混合架构等关键突破,助你为不同场景(文本、多模态、长上下文、混合模型)选择最优方案。

2026-03-03 21:07:47 617

原创 PhysioDSP:一个面向可穿戴设备的 Python 信号处理库

PhysioDSP 是一个开源Python库,旨在统一可穿戴设备生理信号处理流程。它提供类型安全、可复现的算法框架,支持ECG、HRV及加速度计等多模态数据,内置活动分析、QRS检测与HRV评分模块,接口标准化,易于扩展与集成。

2026-03-02 21:18:02 732

原创 VAE 原理拆解:从概率编码到潜在空间正则化

本文深入浅出拆解VAE构建全流程,聚焦实现、训练、调试与部署,而非纯数学推导。逐行解读PyTorch最小实现,详解编码器、重参数化、解码器三大组件及损失设计,并系统介绍训练后五大推理模式:异常检测、生成合成数据、条件生成、潜在空间分析与数据填补。

2026-03-01 21:47:58 1150

原创 基于能量的模型(EBM):用能量函数替代概率分布的建模框架

Yann LeCun指出,当前LLM逐Token预测的路径难达人类级AI;其团队力推基于能量的模型(EBM)——不依赖Softmax归一化,以“能量”度量兼容性,支持多峰建模、连续优化与世界模型构建,为通用智能提供新范式。

2026-02-28 20:44:28 1023

原创 时间序列异常检测的5种方法:从统计阈值到深度学习

时间序列异常检测旨在识别偏离正常规律的数据点,如凌晨流量突增、传感器骤降等。因数据含趋势、季节性与噪声,需结合统计法(Z-Score)、移动平均、季节分解、Isolation Forest或自编码器等方法,多策略融合可有效降低误报。

2026-02-27 21:21:26 578

原创 从提示工程转向 上下文工程,6种让LLM在生产环境中稳定输出的技术

本文系统阐述“上下文工程”(Context Engineering)——生产级AI系统的核心能力。它不依赖提示词优化,而是通过选择性检索、上下文压缩、层次化布局、动态查询重构、记忆注入与工具感知六大技术,精准控制模型在运行时“看到什么、何时看、如何看”,从而根治幻觉、提升准确率、降低Token消耗,让小模型也能稳定输出高质量结果。

2026-02-26 21:27:58 744

原创 向量搜索系统的三个核心优化维度:速度、精度与规模

本文探讨大规模向量搜索的三大核心优化:性能调优(ANN、IVF、HNSW、量化压缩、GPU加速)、混合搜索(关键词+语义加权融合)与可扩展架构(分片、分布式、缓存),解决亿级向量下“又快又准”的工程难题。

2026-02-25 19:53:39 670

原创 手把手搭建 Adaptive RAG 系统:从向量检索到 Streamlit 前端全流程

本文带你从零构建端到端AI技术支持助手POC:基于Adaptive RAG动态调整检索深度,LangGraph编排有状态多步推理,FastAPI提供高性能API,Streamlit实现交互式前端——理论落地,开箱即用。

2026-02-24 20:57:57 1067

原创 深入理解三种PEFT方法:LoRA的低秩更新、QLoRA的4位量化与DoRA的幅度-方向分解

大模型全量微调显存开销巨大(65B模型需130GB),参数高效微调(PEFT)应运而生。LoRA通过低秩矩阵增量更新,节省99%+参数;QLoRA结合4-bit量化(NF4)与LoRA,单卡48GB即可微调65B模型;DoRA进一步解耦权重的幅度与方向,精度显著超越LoRA。三者协同构建高效、低成本、高性能的微调新范式。

2026-02-23 20:51:11 794

原创 并行多智能体系统的协调测试实战:从轨迹捕获到CI/CD的六个步骤

本文探讨并行多智能体系统的协调测试难题:当多个LLM驱动的智能体协同决策时,单个正确≠集体安全。传统单元测试失效,需构建以轨迹捕获、行为不变量、回放回归、黄金数据集和CI/CD集成为核心的新型测试框架,专治容量超限、状态陈旧、 reducer 冲突等典型协调故障。

2026-02-22 21:47:33 1051

原创 RAG 中分块重叠的 8 个隐性开销与权衡策略

本文深入剖析RAG中分块重叠的8大隐藏成本:索引膨胀、Embedding重复收费、检索多样性下降、重排序负载激增、LLM上下文冗余、缓存失效、评估结果漂移及运维风险上升。揭示重叠并非“免费午餐”,而是贯穿全链路的隐性开销。

2026-02-21 21:03:18 854

原创 深入RAG架构:分块策略、混合检索与重排序的工程实现

本文详解RAG系统从Demo迈向生产需攻克的5个关键层级:基础向量检索(Level 1)、智能分块与元数据增强(Level 2)、混合搜索(语义+关键词,Level 3)、交叉编码器重排序(Level 4),以及生产级护栏、评估与兜底机制(Level 5)。强调“不编造、可验证、易诊断”,聚焦真实故障场景与可落地优化。

2026-02-20 21:03:47 1180 1

原创 AI Agent技术栈:10个构建生产级Agent的核心概念

本文揭示Agentic AI稳定运行的核心不在大模型或提示词,而在于系统设计。文章精炼总结10个关键基础概念:MCP插件协议、推理循环、记忆机制、安全护栏、工具发现、错误恢复、人机协同、上下文工程、状态管理与运行时编排,直击Agent工程化落地痛点。

2026-02-19 22:22:07 903

原创 长上下文“记忆“的舒适陷阱:为什么更多记忆不等于更可靠

本文警示长上下文的隐性风险:它虽提升交互顺手度,却严重损害可靠性、可测试性与可重复性;共享账户导致意图混杂,“我是谁”故障频发;向量平均无法调和对立目标;上下文膨胀引发注意力稀释、幻觉加剧与约束遗忘。生产中须以预算制、会话隔离、结构化记忆和可控重置进行主动治理。

2026-02-18 21:59:32 956

原创 超越上下文窗口:CodeAct与RLM,两种代码驱动的LLM扩展方案

本文介绍CodeAct与RLM两大前沿范式:CodeAct让模型用可执行代码调用工具,缓解Context Rot,提升多工具任务成功率;RLM则通过递归分解超长上下文,将推理转化为编程式搜索。二者分别重构“动作空间”与“推理结构”,共同推动LLM从黑箱生成器迈向可编程智能体。

2026-02-16 22:02:12 1117

原创 15 分钟用 FastMCP 搭建你的第一个 MCP Server(附完整代码)

Model Context Protocol(MCP)是一个轻量开放标准,让LLM能统一、可靠地调用外部工具。无需手写解析逻辑或维护胶水代码。核心仅三概念:Server(暴露工具)、Tool(带装饰器的函数)、Client(调用方)。FastMCP框架15分钟即可上手,支持stdio快速测试、HTTP生产部署,真正实现“写一次,随处调用”。

2026-02-15 22:46:32 840

原创 Prompt 缓存的四种策略:从精确匹配到语义检索

本文详解Prompt缓存四大策略(精确匹配、规范化、语义相似、分层架构),直击LLM应用成本痛点——重复调用导致API费用飙升。代码示例+架构图,助你低成本提升命中率,降本30%–90%,延迟同步优化。

2026-02-14 20:27:44 1200 1

原创 RAG 文本分块:七种主流策略的原理与适用场景

分块是RAG系统的基石,直接影响检索质量与LLM推理效果。行业共识:“分块决定RAG质量的70%”。从固定大小、句子/段落级,到语义、递归、滑动窗口及层次化分块,策略需匹配文档类型与任务需求。劣质分块导致上下文断裂、噪声激增、幻觉频发——燃料不行,再强的引擎也徒劳。

2026-02-13 21:33:41 1148

原创 LLM创造力可以被度量吗?一个基于提示词变更的探索性实验

本文探讨提示词工程为何仍是“玄学”,并通过实验证明:加入明确指令(如“Be as creative as possible”)可显著、可量化地提升LLM输出多样性,效果甚至超过调高温度。研究以embedding距离为代理指标,覆盖13个主流模型,揭示提示词迭代可度量、可预测,为LLM应用从经验走向工程化提供新路径。

2026-02-12 20:56:38 998

原创 Agent Lightning:微软开源的框架无关 Agent 训练方案,LangChain/AutoGen 都能用

Agent Lightning 是微软推出的开源工具,专攻AI Agent“训练鸿沟”——无需修改代码,即可为LangChain、AutoGen等任意框架注入强化学习、Prompt优化与微调能力,让Agent在真实交互中持续进化。

2026-02-11 21:40:27 946

原创 软件工程原则在多智能体系统中的应用:分层与解耦

本文探讨多智能体系统的工程化架构设计,以YouTube视频信息提取项目为例,提出分层架构(呈现层、智能体层、工具层、服务层、模型层、基础设施层),强调工具(LLM适配器)与服务(业务逻辑)的严格分离,并引入领域驱动设计思想,实现可维护、可测试、可扩展的智能体系统。

2026-02-10 21:35:37 725

原创 一分钟训练搞懂 DPPO:把扩散过程建模为 MDP 的强化学习方法

本文以二维环形环境为简化平台,探究DPPO(扩散策略策略优化)算法的训练机制:将扩散去噪过程建模为MDP,用PPO微调单条轨迹,分析KL约束、微调步数、eps clip与学习率等对行为分布与收敛性的影响,揭示RL+扩散在机器人策略优化中的关键挑战与设计权衡。

2026-02-09 20:37:57 1208

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除