自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

打造全国最全的AI Agent开发知识领域的博客

实战级AI Agent以及相关架构博客,生产级设计与代码示例,以喂饭式教程带领读者从浅入深学习最前沿的技术。

  • 博客(1037)
  • 资源 (19)
  • 收藏
  • 关注

原创 将流形理论(Manifold Theory)引入 Embedding 技术与 RAG(检索增强生成)系统的分析框架

本文基于流形理论揭示嵌入本质,解析语义高维分布。结合 Transformer 架构,提出测地线距离与图索引优化策略,解决检索拓扑断裂。实践验证性能提升,展望动态流形与多模态融合,为构建鲁棒 RAG 系统提供几何视角创新路径与实践方案。

2026-02-27 16:14:03 605

原创 AI Agent中的 ReAct 和 Ralph Loop对比说明

当 AI 编程工具“以为自己完成了”却没真正完成时,开发者只能手动重试。Ralph Loop 通过外部验证与强制循环,让 AI 持续工作直到任务真正达标,解决了 LLM 自我评估不可靠的核心问题。

2026-02-13 15:34:46 833

原创 当被面试管问到:Agent的意图识别如何做到95%准确率?你怎么回答?

达到95%准确率绝非单一技术突破,而是分类体系、数据质量、系统架构、持续迭代四维协同的系统工程。全文结合了智能汽车、电商等场景,分层拆解可落地的关键路径。

2026-02-12 16:16:28 1267

原创 记住,生产级RAG的核心不在于“大模型选了好”

RAG 的成败不在大模型,而在系统工程。本文系统拆解生产级 RAG 架构的七大核心环节,揭示为何多数 Demo 级方案无法落地,并给出可工程化的实践路径。

2026-02-12 16:02:31 622

原创 整理了一套可落地的RAG分片验证指标体系给到大家

再拍脑袋切块了!本文系统拆解 Chunking 质量验证的三层指标体系——从物理分布到检索效果再到最终答案,手把手教你用数据说话,避免“切得自己都看不懂”的尴尬局面。

2026-02-11 21:38:13 972

原创 RAG不是万能的,但没有RAG是万万不能的:8种主流架构全景解析

RAG不是简单“检索+生成”,而是知识与推理的精密耦合。本文系统剖析8种主流RAG架构——从Naive到SFR,揭示其设计逻辑、适用边界与工程权衡,辅以LangChain可运行代码,助你构建真正可靠的知识增强系统。

2026-02-11 21:33:31 662

原创 垂域大模型评估不再靠“感觉”:用结构化测试集+自动化打分实现效果可量化

垂域大模型落地难,不在训练而在评估。本文系统讲解如何从非结构化文档一键生成多题型测试集,并结合规则判分与教师模型打分,构建可量化、可对比、可追踪的评估闭环,让SFT/RAG调优效率翻倍。

2026-02-11 21:21:20 653

原创 RAG可以不用向量库?来围观一下这是怎么回事呢

传统向量RAG在专业长文档中常因“相似≠相关”而失效。一种新方法——PageIndex,放弃向量检索,转而构建文档结构索引,让模型像人一样“翻书”推理。实测在金融等强逻辑场景下准确率高达98.7%,为RAG提供了一条更可靠的新路径。

2026-02-09 15:23:12 645

原创 AI Agent如何实现记忆的三个维度详尽分析

智能体记忆远不止是“记住对话历史”。本文系统拆解其在形式上的三类实现(词元级、参数化、潜在记忆)、功能上的三大支柱(事实、经验、工作记忆)以及动态层面的形成-演化-检索闭环,揭示记忆如何使大模型从静态生成器转变为持续进化的智能体。

2026-02-09 15:12:36 837

原创 一起来围观Anthropic官方万的AI Agent评估方法论

为什么你的 Agent 总是“看起来行,实际上不行”?本文系统拆解 Anthropic 提出的 AI Agent 评估方法论,从 Transcript 与 Outcome 的根本区分,到三类评分器的组合策略,再到 pass@k 与 pass^k 的指标选择逻辑,揭示如何构建一个既能捕捉能力边界、又能保障稳定性的评估体系。这不是一套测试工具,而是一套理解智能体行为的语言。

2026-02-08 15:59:52 1030

原创 多模态 RAG 的新范式:Qwen3-VL-Embedding 与 Reranker 如何统一图文视频检索

Qwen3-VL-Embedding 与 Reranker 通过统一的多模态表征空间、三阶段训练策略和量化友好设计,解决了传统 CLIP 类模型在复杂文档与视频检索中的细粒度交互缺失问题,为视觉密集型 RAG 系统提供了端到端可行方案。

2026-02-06 23:46:08 843

原创 AI接管编码:软件工程师的“主编化”转型已不可逆

AI正以惊人速度接管代码编写,工程师角色正从“写作者”转向“审校者”。本文系统剖析这一趋势的技术动因、现实进展与职业影响,并指出:掌握AI协作能力,已成为新一代工程师的生存基本功。

2026-02-05 23:20:07 813

原创 Qwen3-Coder-Next开源了:来看它如何用3B激活参数撬动80B潜力的

仅激活30亿参数却能匹敌更大模型,Qwen3-Coder-Next通过大规模可执行任务训练与MoE架构,在真实软件工程环境中验证了“小激活、大能力”的可行性,为高效编程智能体提供了新路径。

2026-02-05 14:03:41 828

原创 蚂蚁最新8B小模型拿下SOTA

抛弃ID Embedding和LoRA参数,用自然语言描述用户偏好——蚂蚁与东北大学提出的AlignXplore+框架,以8B小模型实现跨任务、跨模型的SOTA个性化能力,让大模型真正“读懂”每一个具体的人。

2026-02-04 21:40:07 921

原创 自注意力机制如何让大模型真正“看见”上下文?

自注意力机制是Transformer架构的核心组件,它使模型能够动态衡量序列中任意两个元素的相关性,突破了传统RNN类模型在长距离依赖和并行计算上的瓶颈。本文系统解析其工作原理、多头扩展、计算特性及在多模态场景中的泛化能力,并探讨其作为大模型“感知引擎”的底层逻辑与未来演进方向。

2026-02-04 15:47:30 744

原创 RAG不是“能答就行”:一套可落地的评估体系,才是系统真正可用的关键

别再靠“感觉”调RAG了!本文系统拆解检索增强生成系统的评估方法论,从指标设计、工具选型到闭环落地,提供可直接复用的12项核心指标与5步实施流程,帮你把RAG从“能用”推向“好用”,让每一次优化都有数据支撑。

2026-02-04 15:35:14 733

原创 多模态RAG不是“加个图”那么简单:从解析到生成的全流程拆解

多模态RAG不是简单拼图,而是让文字、图片、音频在同一个语义空间里“对上暗号”。本文系统拆解其实现流程,从文档解析、嵌入融合到上下文构建,告诉你为什么“看起来很美”的多模态RAG,工程落地时却总让人直呼“这锅我不背”。

2026-02-01 17:23:14 615

原创 考虑多智能体在B端落地前企业自身需考虑管理文化的“AI化”

复杂B端业务中,单体“全能”智能体看似强大,实则脆弱。真正能稳定交付结果的,是分工明确、协同有序的多智能体架构——它把意图理解、任务规划与工具调用彻底解耦,让每个“数字员工”只做最擅长的事。

2026-02-01 17:17:58 646

原创 AI Agent开发第103课-LangChain入门(十五)- LangGraph为什么这么香,看它是如何逆天DIFY的

想打造能“边思考边行动”的智能体?本文通过一个动态多知识库检索场景,对比纯代码、RunnableBranch 和 LangGraph 三种实现方式,揭示为何在涉及循环、状态与动态决策的复杂流程中,LangGraph 不仅远超传统链式编排,更碾压 DIFY 等低代码平台。附详细代码、优劣分析与对比表格,带你看清:真正强大的 AI Agent,离不开 LangGraph 这个主编排大脑。

2026-02-01 00:03:03 1172

原创 AI Agent开发第102课-LangChain入门(十四)- Agentic RAG 的正确打开方式:用 LangChain 实现“有思考、可解释、不遗漏”的检索增强问答

你是否还在用串行循环多次调用 LLM 做中间回答?本文系统剖析基于 LangChain 与 Qdrant 的 Agentic RAG 流程,指出当前主流做法的合理性边界,并提出兼顾交互性、一致性与召回率的工程化方案——让 AI 不仅能答对,还能让用户看清它是怎么想的。

2026-01-30 23:38:36 769

原创 丢掉向量数据库!推理型 RAG 正在重新定义长文档问答的准确边界

传统 RAG 在处理专业长文档时频频失效,因其依赖语义相似度而非逻辑相关性。PageIndex 提出“无向量推理型 RAG”架构,通过构建语义树索引与路径推理,实现 98.7% 的金融问答准确率,彻底告别切片、向量库与黑盒检索。

2026-01-30 17:35:34 667

原创 AI Agent开发第101课-LangChain入门(十三)- 6步实操Agent落地大法

本文拆解 LangChain 团队验证的 6 步 Agent 落地方法,从任务定义到真实上线,用工程师熟悉的逻辑讲清楚“怎么开始、怎么验证、怎么迭代”。不谈概念,只讲操作,让技术人真正把 Agent 做出来。

2026-01-30 17:30:47 768

原创 GroupRank:分组重排,让大模型在 RAG 中又快又好地“挑重点”

RAG 系统中的重排序器长期面临效率与效果的两难。GroupRank 提出“组式”(Groupwise)新范式,在组内做比较、跨组可并行,既保留逐点灵活性,又具备列表式全局感知能力,并通过合成数据与强化学习训练,实现速度与精度的双重突破。

2026-01-28 16:57:02 570

原创 RAG中的四类索引,你都搞清楚了吗?

索引 ≠ 检索。RAG系统中,索引是为“更好被找到”而设计的结构,而非原始文档的简单存储。本文系统剖析四种智能索引方法——分块、子块、查询与摘要索引,揭示其适用场景与核心原理,并指出:只有让索引变聪明,生成才能真正靠谱。

2026-01-28 16:53:02 941

原创 RAG不是魔法,是工程:从知识库到企业部署的硬核实践

RAG不是万能解药,但它是当前大模型落地最可行的路径。本文系统拆解RAG全链路——从文档解析、向量构建、检索优化到生成控制与企业部署,揭示其成功依赖的不是模型本身,而是扎实的工程细节与对业务场景的深刻理解。

2026-01-27 22:00:54 763

原创 RAG落地不是拼乐高:三层架构才是知识库的真正骨架

RAG系统落地成败,关键不在大模型,而在知识库的三层架构是否扎实。本文从存储、处理到检索,系统拆解RAG知识库的核心组件与工程逻辑,揭示为何多数项目卡在“能用”却难“好用”。

2026-01-27 21:55:06 738

原创 微服务架构设计大比拼:独立数据库 VS 集中式DAO,谁才是真香定律?

本文深入探讨微服务架构中两种数据层设计模式的优劣,分析独立数据库与集中式DAO的实战表现。通过对比连接管理、弹性扩容等核心问题,揭示90%企业微服务转型的痛点,并提供切实可行的优化方案。读完本文将帮你避开微服务数据层的那些坑!

2026-01-26 23:04:18 891

原创 Agent Skills:让你的AI编程助手真正“记住”你的喜好

本文深入解析Agent Skills技术原理,揭示如何通过结构化文档让AI编程助手记住用户偏好,实现精准的代码生成。从基础提示词优化到动态加载机制,逐步展示如何构建个性化AI开发工作流。

2026-01-26 23:02:13 1094

原创 AI Agent开发第100课-LangChain入门(十二)LangChain里的智能“降级”fallback-chain实战

本文深入解析LangChain的Fallback Chain机制,通过实际代码示例展示如何构建具备自动降级能力的AI应用系统。当主模型服务异常时,系统能无缝切换备用方案,保障服务持续可用。

2026-01-25 15:01:42 536

原创 Agent时代产品经理的进化:从需求翻译到问题塑造者

AI Agent正在重塑产品经理的角色。传统需求文档撰写者面临淘汰,而擅长问题定义和解决方案评估的PM将获得更大价值。本文探讨Agent时代产品经理需要掌握的新技能和工作模式转变。

2026-01-24 22:57:07 946

原创 AI Agent开发第99课-LangChain入门(十一)- 如何做到多模型路由策略以及智能切换LLM

本文深入探讨LangChain中实现大语言模型智能切换的实用方案,通过质量检测、熔断机制和性能监控,构建高可用的AI应用系统,为开发者提供企业级解决方案。

2026-01-24 19:52:23 1290

原创 向量数据库:从数学原理到技术落地的深度剖析

本文将系统解析向量数据库的核心技术原理,涵盖向量表示、嵌入技术、索引算法、相似度计算等关键环节。通过深入浅出的技术解读,帮助开发者全面理解这一推动AI应用落地的关键基础设施。

2026-01-23 14:45:54 639

原创 无师自通:Meta如何让AI在零数据环境下自我进化出顶级搜索能力

Meta的Dr. Zero框架突破性地实现了AI在零人类标注数据情况下的自我进化。通过提问者与解答者的自我博弈机制,配合创新的跳数分组优化算法,大语言模型仅凭搜索引擎就能训练出超越监督学习水平的搜索智能体。这种方法为解决数据稀缺问题开辟了新路径。

2026-01-23 14:40:31 887

原创 AI Agent开发第98课-LangChain入门(十)- 用SequentialChain构建智能意图识别系统

本文深入解析LangChain中的SequentialChain,通过一个完整的意图识别案例展示其强大功能。对比手动串联链的实现方式,揭示SequentialChain在可维护性和扩展性上的优势,为开发者提供实用的架构设计思路。

2026-01-22 22:54:22 596

原创 AI Agent开发第97课-LangChain入门(九)- 从单元测试到行为轨迹追踪,让你的AI不再“乱拐弯”

想知道你的AI智能体是真聪明还是装聪明?本文带你深入LangChain测试体系,从基础单元测试到高级行为轨迹分析,教你如何像老司机一样把控AI的“驾驶行为”,避免模型在路上“翻车”又“绕路”。

2026-01-21 21:49:58 660

原创 AI Agent 开发第96课-LangChain入门(八)- 本地向量化-sentence-transformers的正确使用方式

为什么国内开发者做RAG首选sentence-transformers?本文系统拆解其在LangChain中的定位、原理与最佳实践,澄清“HuggingFaceEmbeddings是否必须”“是否联网下载”等核心疑问,助你构建安全、高效、可维护的私有化语义系统。

2026-01-21 21:12:09 884

原创 AI Agent开发第95课-LangChain入门(七)- 利用LangChain的MapReduce做个支持可续写的爆文生成器

本文基于LangChain的MapReduce模式,构建一个支持可续写的爆文生成器。用户可自定义目标字数、读者群体、语言口吻、写作风格及附加约束条件。系统将长文任务分解为多个可控子段落,分别生成后智能合并,有效规避上下文窗口限制。实测表明,该方法生成内容逻辑连贯、风格统一,无典型AI生硬感。笔者认为,此类架构之所以效果突出,关键在于将“全局一致性”与“局部灵活性”解耦——先通过reduce阶段对齐主旨,再在map阶段释放细节创造力。这不仅是工程技巧,更是对语言生成本质的一种务实理解。生成器输出质量已达到业界

2026-01-20 23:57:29 1565 1

原创 AI Agent开发第94课-LangChain入门(六)- 超长文本处理的优雅解法:10行代码搞定180K字摘要

本文详解如何用LangChain内置的map_reduce机制,仅需10余行代码高效处理16K、32K甚至180K字的超长文本摘要问题,避免传统方案中的超时与性能瓶颈,支持本地小模型或Qwen-Turbo等快速大模型,实现低延迟、高可用的上下文压缩。

2026-01-20 15:14:52 704

原创 RAG不是万能的:没有可观测性,你的系统只是在“碰运气”

RAG系统上线后表现如何?别再靠“感觉”判断了。本文系统拆解RAG可观测性评估的核心指标,从检索到生成,从自洽性到显式验证,告诉你如何用可量化、可追踪、可归因的方法,把RAG从Demo变成真正可信的生产级AI产品。

2026-01-20 15:00:45 821

原创 RAG不是万能药:一份来自实战的避坑指南

本文系统梳理RAG落地过程中的26个高频问题,从选型决策、分块策略、检索优化到评估维护,结合工程实践与原理分析,揭示“看似简单”的RAG背后隐藏的技术细节与调优空间。适合正在构建或优化RAG系统的开发者收藏参考。

2026-01-19 16:00:21 988

从玩具到工具:LangChain 入门教程代码demo

从玩具到工具:LangChain 入门教程代码demo

2026-01-16

mnist手写数字训练集

mnist手写数字训练集,用于训练神经网络识别手写阿拉伯数字用。

2025-11-01

ibatis 开发指南

IBATIS官方教程(中文)

2007-09-14

fox999_workflow_features_2004A

银狐写的著名的工作流功能列表

2007-09-14

高杰的JBPM从入门到精通

JBPM是一个扩展性很强的工作流系统,百分百用JAVA语言开发,持久层采用Hibernate实现,理论上说,只要Hibernate支持的数据库JBPM都支持。同时它还能被部署在任何一款JAVA应用服务器上

2011-04-04

Experience J2EE! Using WebSphere Application Server V6.1

IBM公司的Websphere application server6.1 红皮开发技术书之一(图文并茂),极适合初学者

2011-04-04

原版精美通向架构师的道路第十四天至第十七天Word文档

此为本人原版word文档,用于在公司内部作技术强化用,原名为“通向八段的道路”,因为本系列计划想写365天,研读完365天的人应该达到或者超过一个5年-6年的左右的高级J2EE工程师,自己曾经研究过IBM上海GDCC以及IBM上海Innovation觉得该365天内容学完可以初步达到IBM内部八段的水平及相当于一个架构师的水平。 本人在公司内部发布该套教程时同时在网上也进行发布起名为“通向架构师的道路”,而此次上传的为原版精排版word文档,带有目录和完整正确格式的文档,希望能以此给更多的读者在今后的工作和学习中带来帮助

2012-10-22

openssl for win

网上下载的openssl for win虽然是.exe文件和dll的组合,但是由于其是从linux/unix下编译过来的,因此它的一些目录与配置文件尚保留着linux/unix下的格式,比如说你装在d:\openssl目录下,它的conf文件内对于内带ca的引用还是/home/democa这样的格式,因此这些目录与资源的引用需要改成windows下的目录和路径相关。 为方便大家使用,我已经进行了相关的修改,大家下载此openssl for win后解压后直接在windows环境变量设置相关的: OPENSSL_HOME与openssl_conf 即可使用,为此我收取资源分1点!

2012-08-10

通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力的sample工程

该Sample工程为通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力一文中所用的例子。它是基于ibm compute grid的批处理开发框架v.6.1.1.1.1基础上来开发的。 包含有用于读的样本文本文件、源代码与相关配置。

2013-01-15

通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子

通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子,内含maven的pom.xml文件与build.xml

2012-12-03

SSH_Alpha工程人附属lib包

通向架构师的道路(第十八天)万能框架Spring(一)教程所属相关工程,大家可以下载下来后导入eclipse用,相关的lib目录下的jar文件已经删了,大家可以自行去下载spring3, struts1.3, hibernate3与jasypt,这些网上都是公开和免费的。我也上传了一份,我本意是大家自己去把这些包整合起来因为我已经发了jar list,不过因为是我整合的,因此收资源分1分

2012-10-22

通向架构师的道路第十八到第二十三天的例子

通向架构师的道路第十八到第二十三天的例子

2012-12-02

maven-ant-tasks-2.1.3.jar

maven-ant-tasks-2.1.3.jar

2012-11-19

hypersonic

hypersonic官方文档

2007-09-07

IBM RAD7.5开发指南part1(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

mod_jk for apache 2.2.x

mod_jk for apache 2.2.x

2012-08-18

spring in action

spring in action官方教程

2007-09-04

IBM RAD7.5开发指南part2(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

IBM RAD7.5开发指南part3(全图文教程,超灵)

IBM超经典RAD7.5下开发was及websphere portal的教程,详细步骤全图文式解说

2011-04-04

jbossgettingstart

jboss4.x getting start官方中文教程

2007-09-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除