- 博客(1037)
- 资源 (19)
- 收藏
- 关注
原创 将流形理论(Manifold Theory)引入 Embedding 技术与 RAG(检索增强生成)系统的分析框架
本文基于流形理论揭示嵌入本质,解析语义高维分布。结合 Transformer 架构,提出测地线距离与图索引优化策略,解决检索拓扑断裂。实践验证性能提升,展望动态流形与多模态融合,为构建鲁棒 RAG 系统提供几何视角创新路径与实践方案。
2026-02-27 16:14:03
605
原创 AI Agent中的 ReAct 和 Ralph Loop对比说明
当 AI 编程工具“以为自己完成了”却没真正完成时,开发者只能手动重试。Ralph Loop 通过外部验证与强制循环,让 AI 持续工作直到任务真正达标,解决了 LLM 自我评估不可靠的核心问题。
2026-02-13 15:34:46
833
原创 当被面试管问到:Agent的意图识别如何做到95%准确率?你怎么回答?
达到95%准确率绝非单一技术突破,而是分类体系、数据质量、系统架构、持续迭代四维协同的系统工程。全文结合了智能汽车、电商等场景,分层拆解可落地的关键路径。
2026-02-12 16:16:28
1267
原创 记住,生产级RAG的核心不在于“大模型选了好”
RAG 的成败不在大模型,而在系统工程。本文系统拆解生产级 RAG 架构的七大核心环节,揭示为何多数 Demo 级方案无法落地,并给出可工程化的实践路径。
2026-02-12 16:02:31
622
原创 整理了一套可落地的RAG分片验证指标体系给到大家
再拍脑袋切块了!本文系统拆解 Chunking 质量验证的三层指标体系——从物理分布到检索效果再到最终答案,手把手教你用数据说话,避免“切得自己都看不懂”的尴尬局面。
2026-02-11 21:38:13
972
原创 RAG不是万能的,但没有RAG是万万不能的:8种主流架构全景解析
RAG不是简单“检索+生成”,而是知识与推理的精密耦合。本文系统剖析8种主流RAG架构——从Naive到SFR,揭示其设计逻辑、适用边界与工程权衡,辅以LangChain可运行代码,助你构建真正可靠的知识增强系统。
2026-02-11 21:33:31
662
原创 垂域大模型评估不再靠“感觉”:用结构化测试集+自动化打分实现效果可量化
垂域大模型落地难,不在训练而在评估。本文系统讲解如何从非结构化文档一键生成多题型测试集,并结合规则判分与教师模型打分,构建可量化、可对比、可追踪的评估闭环,让SFT/RAG调优效率翻倍。
2026-02-11 21:21:20
653
原创 RAG可以不用向量库?来围观一下这是怎么回事呢
传统向量RAG在专业长文档中常因“相似≠相关”而失效。一种新方法——PageIndex,放弃向量检索,转而构建文档结构索引,让模型像人一样“翻书”推理。实测在金融等强逻辑场景下准确率高达98.7%,为RAG提供了一条更可靠的新路径。
2026-02-09 15:23:12
645
原创 AI Agent如何实现记忆的三个维度详尽分析
智能体记忆远不止是“记住对话历史”。本文系统拆解其在形式上的三类实现(词元级、参数化、潜在记忆)、功能上的三大支柱(事实、经验、工作记忆)以及动态层面的形成-演化-检索闭环,揭示记忆如何使大模型从静态生成器转变为持续进化的智能体。
2026-02-09 15:12:36
837
原创 一起来围观Anthropic官方万的AI Agent评估方法论
为什么你的 Agent 总是“看起来行,实际上不行”?本文系统拆解 Anthropic 提出的 AI Agent 评估方法论,从 Transcript 与 Outcome 的根本区分,到三类评分器的组合策略,再到 pass@k 与 pass^k 的指标选择逻辑,揭示如何构建一个既能捕捉能力边界、又能保障稳定性的评估体系。这不是一套测试工具,而是一套理解智能体行为的语言。
2026-02-08 15:59:52
1030
原创 多模态 RAG 的新范式:Qwen3-VL-Embedding 与 Reranker 如何统一图文视频检索
Qwen3-VL-Embedding 与 Reranker 通过统一的多模态表征空间、三阶段训练策略和量化友好设计,解决了传统 CLIP 类模型在复杂文档与视频检索中的细粒度交互缺失问题,为视觉密集型 RAG 系统提供了端到端可行方案。
2026-02-06 23:46:08
843
原创 AI接管编码:软件工程师的“主编化”转型已不可逆
AI正以惊人速度接管代码编写,工程师角色正从“写作者”转向“审校者”。本文系统剖析这一趋势的技术动因、现实进展与职业影响,并指出:掌握AI协作能力,已成为新一代工程师的生存基本功。
2026-02-05 23:20:07
813
原创 Qwen3-Coder-Next开源了:来看它如何用3B激活参数撬动80B潜力的
仅激活30亿参数却能匹敌更大模型,Qwen3-Coder-Next通过大规模可执行任务训练与MoE架构,在真实软件工程环境中验证了“小激活、大能力”的可行性,为高效编程智能体提供了新路径。
2026-02-05 14:03:41
828
原创 蚂蚁最新8B小模型拿下SOTA
抛弃ID Embedding和LoRA参数,用自然语言描述用户偏好——蚂蚁与东北大学提出的AlignXplore+框架,以8B小模型实现跨任务、跨模型的SOTA个性化能力,让大模型真正“读懂”每一个具体的人。
2026-02-04 21:40:07
921
原创 自注意力机制如何让大模型真正“看见”上下文?
自注意力机制是Transformer架构的核心组件,它使模型能够动态衡量序列中任意两个元素的相关性,突破了传统RNN类模型在长距离依赖和并行计算上的瓶颈。本文系统解析其工作原理、多头扩展、计算特性及在多模态场景中的泛化能力,并探讨其作为大模型“感知引擎”的底层逻辑与未来演进方向。
2026-02-04 15:47:30
744
原创 RAG不是“能答就行”:一套可落地的评估体系,才是系统真正可用的关键
别再靠“感觉”调RAG了!本文系统拆解检索增强生成系统的评估方法论,从指标设计、工具选型到闭环落地,提供可直接复用的12项核心指标与5步实施流程,帮你把RAG从“能用”推向“好用”,让每一次优化都有数据支撑。
2026-02-04 15:35:14
733
原创 多模态RAG不是“加个图”那么简单:从解析到生成的全流程拆解
多模态RAG不是简单拼图,而是让文字、图片、音频在同一个语义空间里“对上暗号”。本文系统拆解其实现流程,从文档解析、嵌入融合到上下文构建,告诉你为什么“看起来很美”的多模态RAG,工程落地时却总让人直呼“这锅我不背”。
2026-02-01 17:23:14
615
原创 考虑多智能体在B端落地前企业自身需考虑管理文化的“AI化”
复杂B端业务中,单体“全能”智能体看似强大,实则脆弱。真正能稳定交付结果的,是分工明确、协同有序的多智能体架构——它把意图理解、任务规划与工具调用彻底解耦,让每个“数字员工”只做最擅长的事。
2026-02-01 17:17:58
646
原创 AI Agent开发第103课-LangChain入门(十五)- LangGraph为什么这么香,看它是如何逆天DIFY的
想打造能“边思考边行动”的智能体?本文通过一个动态多知识库检索场景,对比纯代码、RunnableBranch 和 LangGraph 三种实现方式,揭示为何在涉及循环、状态与动态决策的复杂流程中,LangGraph 不仅远超传统链式编排,更碾压 DIFY 等低代码平台。附详细代码、优劣分析与对比表格,带你看清:真正强大的 AI Agent,离不开 LangGraph 这个主编排大脑。
2026-02-01 00:03:03
1172
原创 AI Agent开发第102课-LangChain入门(十四)- Agentic RAG 的正确打开方式:用 LangChain 实现“有思考、可解释、不遗漏”的检索增强问答
你是否还在用串行循环多次调用 LLM 做中间回答?本文系统剖析基于 LangChain 与 Qdrant 的 Agentic RAG 流程,指出当前主流做法的合理性边界,并提出兼顾交互性、一致性与召回率的工程化方案——让 AI 不仅能答对,还能让用户看清它是怎么想的。
2026-01-30 23:38:36
769
原创 丢掉向量数据库!推理型 RAG 正在重新定义长文档问答的准确边界
传统 RAG 在处理专业长文档时频频失效,因其依赖语义相似度而非逻辑相关性。PageIndex 提出“无向量推理型 RAG”架构,通过构建语义树索引与路径推理,实现 98.7% 的金融问答准确率,彻底告别切片、向量库与黑盒检索。
2026-01-30 17:35:34
667
原创 AI Agent开发第101课-LangChain入门(十三)- 6步实操Agent落地大法
本文拆解 LangChain 团队验证的 6 步 Agent 落地方法,从任务定义到真实上线,用工程师熟悉的逻辑讲清楚“怎么开始、怎么验证、怎么迭代”。不谈概念,只讲操作,让技术人真正把 Agent 做出来。
2026-01-30 17:30:47
768
原创 GroupRank:分组重排,让大模型在 RAG 中又快又好地“挑重点”
RAG 系统中的重排序器长期面临效率与效果的两难。GroupRank 提出“组式”(Groupwise)新范式,在组内做比较、跨组可并行,既保留逐点灵活性,又具备列表式全局感知能力,并通过合成数据与强化学习训练,实现速度与精度的双重突破。
2026-01-28 16:57:02
570
原创 RAG中的四类索引,你都搞清楚了吗?
索引 ≠ 检索。RAG系统中,索引是为“更好被找到”而设计的结构,而非原始文档的简单存储。本文系统剖析四种智能索引方法——分块、子块、查询与摘要索引,揭示其适用场景与核心原理,并指出:只有让索引变聪明,生成才能真正靠谱。
2026-01-28 16:53:02
941
原创 RAG不是魔法,是工程:从知识库到企业部署的硬核实践
RAG不是万能解药,但它是当前大模型落地最可行的路径。本文系统拆解RAG全链路——从文档解析、向量构建、检索优化到生成控制与企业部署,揭示其成功依赖的不是模型本身,而是扎实的工程细节与对业务场景的深刻理解。
2026-01-27 22:00:54
763
原创 RAG落地不是拼乐高:三层架构才是知识库的真正骨架
RAG系统落地成败,关键不在大模型,而在知识库的三层架构是否扎实。本文从存储、处理到检索,系统拆解RAG知识库的核心组件与工程逻辑,揭示为何多数项目卡在“能用”却难“好用”。
2026-01-27 21:55:06
738
原创 微服务架构设计大比拼:独立数据库 VS 集中式DAO,谁才是真香定律?
本文深入探讨微服务架构中两种数据层设计模式的优劣,分析独立数据库与集中式DAO的实战表现。通过对比连接管理、弹性扩容等核心问题,揭示90%企业微服务转型的痛点,并提供切实可行的优化方案。读完本文将帮你避开微服务数据层的那些坑!
2026-01-26 23:04:18
891
原创 Agent Skills:让你的AI编程助手真正“记住”你的喜好
本文深入解析Agent Skills技术原理,揭示如何通过结构化文档让AI编程助手记住用户偏好,实现精准的代码生成。从基础提示词优化到动态加载机制,逐步展示如何构建个性化AI开发工作流。
2026-01-26 23:02:13
1094
原创 AI Agent开发第100课-LangChain入门(十二)LangChain里的智能“降级”fallback-chain实战
本文深入解析LangChain的Fallback Chain机制,通过实际代码示例展示如何构建具备自动降级能力的AI应用系统。当主模型服务异常时,系统能无缝切换备用方案,保障服务持续可用。
2026-01-25 15:01:42
536
原创 Agent时代产品经理的进化:从需求翻译到问题塑造者
AI Agent正在重塑产品经理的角色。传统需求文档撰写者面临淘汰,而擅长问题定义和解决方案评估的PM将获得更大价值。本文探讨Agent时代产品经理需要掌握的新技能和工作模式转变。
2026-01-24 22:57:07
946
原创 AI Agent开发第99课-LangChain入门(十一)- 如何做到多模型路由策略以及智能切换LLM
本文深入探讨LangChain中实现大语言模型智能切换的实用方案,通过质量检测、熔断机制和性能监控,构建高可用的AI应用系统,为开发者提供企业级解决方案。
2026-01-24 19:52:23
1290
原创 向量数据库:从数学原理到技术落地的深度剖析
本文将系统解析向量数据库的核心技术原理,涵盖向量表示、嵌入技术、索引算法、相似度计算等关键环节。通过深入浅出的技术解读,帮助开发者全面理解这一推动AI应用落地的关键基础设施。
2026-01-23 14:45:54
639
原创 无师自通:Meta如何让AI在零数据环境下自我进化出顶级搜索能力
Meta的Dr. Zero框架突破性地实现了AI在零人类标注数据情况下的自我进化。通过提问者与解答者的自我博弈机制,配合创新的跳数分组优化算法,大语言模型仅凭搜索引擎就能训练出超越监督学习水平的搜索智能体。这种方法为解决数据稀缺问题开辟了新路径。
2026-01-23 14:40:31
887
原创 AI Agent开发第98课-LangChain入门(十)- 用SequentialChain构建智能意图识别系统
本文深入解析LangChain中的SequentialChain,通过一个完整的意图识别案例展示其强大功能。对比手动串联链的实现方式,揭示SequentialChain在可维护性和扩展性上的优势,为开发者提供实用的架构设计思路。
2026-01-22 22:54:22
596
原创 AI Agent开发第97课-LangChain入门(九)- 从单元测试到行为轨迹追踪,让你的AI不再“乱拐弯”
想知道你的AI智能体是真聪明还是装聪明?本文带你深入LangChain测试体系,从基础单元测试到高级行为轨迹分析,教你如何像老司机一样把控AI的“驾驶行为”,避免模型在路上“翻车”又“绕路”。
2026-01-21 21:49:58
660
原创 AI Agent 开发第96课-LangChain入门(八)- 本地向量化-sentence-transformers的正确使用方式
为什么国内开发者做RAG首选sentence-transformers?本文系统拆解其在LangChain中的定位、原理与最佳实践,澄清“HuggingFaceEmbeddings是否必须”“是否联网下载”等核心疑问,助你构建安全、高效、可维护的私有化语义系统。
2026-01-21 21:12:09
884
原创 AI Agent开发第95课-LangChain入门(七)- 利用LangChain的MapReduce做个支持可续写的爆文生成器
本文基于LangChain的MapReduce模式,构建一个支持可续写的爆文生成器。用户可自定义目标字数、读者群体、语言口吻、写作风格及附加约束条件。系统将长文任务分解为多个可控子段落,分别生成后智能合并,有效规避上下文窗口限制。实测表明,该方法生成内容逻辑连贯、风格统一,无典型AI生硬感。笔者认为,此类架构之所以效果突出,关键在于将“全局一致性”与“局部灵活性”解耦——先通过reduce阶段对齐主旨,再在map阶段释放细节创造力。这不仅是工程技巧,更是对语言生成本质的一种务实理解。生成器输出质量已达到业界
2026-01-20 23:57:29
1565
1
原创 AI Agent开发第94课-LangChain入门(六)- 超长文本处理的优雅解法:10行代码搞定180K字摘要
本文详解如何用LangChain内置的map_reduce机制,仅需10余行代码高效处理16K、32K甚至180K字的超长文本摘要问题,避免传统方案中的超时与性能瓶颈,支持本地小模型或Qwen-Turbo等快速大模型,实现低延迟、高可用的上下文压缩。
2026-01-20 15:14:52
704
原创 RAG不是万能的:没有可观测性,你的系统只是在“碰运气”
RAG系统上线后表现如何?别再靠“感觉”判断了。本文系统拆解RAG可观测性评估的核心指标,从检索到生成,从自洽性到显式验证,告诉你如何用可量化、可追踪、可归因的方法,把RAG从Demo变成真正可信的生产级AI产品。
2026-01-20 15:00:45
821
原创 RAG不是万能药:一份来自实战的避坑指南
本文系统梳理RAG落地过程中的26个高频问题,从选型决策、分块策略、检索优化到评估维护,结合工程实践与原理分析,揭示“看似简单”的RAG背后隐藏的技术细节与调优空间。适合正在构建或优化RAG系统的开发者收藏参考。
2026-01-19 16:00:21
988
高杰的JBPM从入门到精通
2011-04-04
Experience J2EE! Using WebSphere Application Server V6.1
2011-04-04
原版精美通向架构师的道路第十四天至第十七天Word文档
2012-10-22
openssl for win
2012-08-10
通向架构师的道路(第二十七天)应用IBM网格计算提高批处理能力的sample工程
2013-01-15
通向架构师的道路(第二十五天)SSH的单元测试与dbunit的整合的例子
2012-12-03
SSH_Alpha工程人附属lib包
2012-10-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅