- 博客(275)
- 收藏
- 关注
原创 RAG:2025年检索增强生成前沿技术完全指南
从实验室走向企业级应用,RAG正在重新定义AI系统的构建范式。它通过“检索增强生成”的核心理念,既保留了大语言模型的创造性,又赋予其可追溯、可验证的可信属性。到2025年,随着七大前沿技术的成熟落地,RAG将不再局限于工具层面的优化,而是成为驱动各行业智能化转型的核心引擎。
2025-06-12 08:15:00
1284
原创 构建真正有效的AI代理的七个关键步骤:从理论到实践的完整指南
构建真正有效的AI代理,本质上是一场"去泡沫化"的技术实践。它要求我们跳出"炫技式开发"的陷阱,回归"解决真实问题"的初心。通过本文提出的七大步骤,企业与开发者能够建立一套可复制的方法论,让AI代理从"演示厅的花瓶"转变为"生产线的齿轮",最终在降本增效、创新商业模式等方面释放巨大价值。
2025-06-11 08:15:00
676
原创 上下文窗口错觉:为什么你的 128K token 不起作用
大语言模型的长上下文能力并非“即插即用”的魔法,而是需要精细调校的复杂系统。唯有将工程智慧与技术洞察结合,才能穿透“容量膨胀”的迷雾,让每一个Token都产生真正的商业价值。
2025-06-10 08:15:00
499
原创 如何在不陷入复杂性陷阱的情况下构建生产就绪的 AI 代理
正如Unix之父肯·汤普逊所言:“ simplicity is the ultimate sophistication”(简单是终极的复杂)。在智能体架构的设计中,这种“少即是多”的哲学,或许正是通往可落地AI的必经之路。当每个智能体都能在其专精领域成为“专家”,由它们组成的协同网络,终将比任何单一的“超级智能体”更加强大、可靠且富有生命力。
2025-06-09 08:15:00
1128
原创 一文读懂 Embeddings 与 RAG 架构:分词、向量数据库到生产级系统设计
嵌入与RAG技术的出现,标志着AI系统从“模式匹配”迈向“语义理解”的新纪元。无论是开发企业知识库问答系统,还是构建下一代搜索引擎,掌握从文本到向量、从检索到生成的完整链路,是实现智能系统的关键。通过本文所述的理论基础、技术选型与实践经验,读者可逐步搭建健壮、高效的RAG系统,并在不断迭代中适应AI领域的快速变革。
2025-06-08 08:15:00
855
原创 从数据抓取到智能分类:用 LangChain + 爬虫构建自动化工作流的实战笔记
本文通过作者的实际案例,展示了如何将网络爬虫和大语言模型相结合,解决现实中的繁琐任务自动化问题。这一实践不仅证明了技术在提高工作效率、减少人工劳动方面的巨大潜力,更揭示了构建实用AI解决方案的关键:明确需求、合理分工、选择合适的工具和技术,并在实践中不断迭代和优化。
2025-06-07 08:15:00
632
原创 结合LangGraph、DeepSeek-R1和Qdrant 的混合 RAG 技术实践
本文提出的基于Qdrant miniCOIL、LangGraph和SambaNova DeepSeek-R1的混合RAG方案,通过融合稀疏检索的精准性与稠密检索的语义理解能力,为企业级智能问答提供了高效解决方案。miniCOIL的轻量化设计使其在保持语义增强的同时避免了传统神经检索的存储开销,而LangGraph的可视化流程编排降低了RAG系统的开发门槛。
2025-06-05 08:15:00
872
原创 构建生产级LLM应用完整指南:从原型到落地的全流程实践
本文将以实战为导向,结合代码示例与架构设计,详解如何将一个基于OpenAI API的简单聊天机器人,升级为具备容错能力、成本可控且可弹性扩展的生产级系统。无论你是AI开发者、技术负责人还是创业团队,都能从中获取从环境搭建到运维监控的全生命周期解决方案。
2025-06-04 08:15:00
830
原创 AI 时代下设计模式的逆袭:为何经典架构思想从未过时?
设计模式的本质是软件设计基本原则的具象化,包括封装、抽象、多态、单一职责原则、开闭原则等。GoF模式仅是这些原则在面向对象编程中的具体应用示例,而架构模式、领域模式则是原则在更高层次的延伸。在AI时代,这些原则的重要性并未减弱,反而因开发效率的提升而更加凸显。AI能快速生成代码,但缺乏对原则的理解,无法判断代码是否遵循“高内聚、低耦合”“对扩展开放、对修改关闭”等核心思想。人类开发者的职责,正是通过设计模式将这些原则注入到AI生成的代码中,确保系统具备长期演进的能力。
2025-06-03 08:15:00
631
原创 RAG中基于图的重排序:利用图神经网络革新信息检索(含代码)
基于图的重排序技术通过将检索问题转化为图结构中的关系推理,突破了传统模型“孤立评分”的局限,为信息检索带来了三大核心价值:全局语义建模能力、结构化知识注入能力、动态关联推理能力。
2025-06-02 08:15:00
742
原创 从执行轨迹到结果质量:AI 代理系统评估的核心要素与方法论
人工智能代理系统的评估是一个复杂的挑战,远远超出了传统的模型评估。它不仅需要理解最终输出,还需要理解系统的中间决策、工具使用和推理路径。通过采用基于代码的评估、以大型语言模型作为评判者的评估和人工标注等多种评估方法,结合对代理轨迹的分析,我们可以更全面、准确地评估人工智能代理系统的性能。
2025-06-01 08:15:00
810
原创 Agentic RAG 的技术演进详解
Agentic RAG的出现,不仅是技术的革新,更是人机关系的重新定义。它让机器从“按指令行事的工具”进化为“理解需求、自主决策、持续进化的伙伴”,人类得以从重复性知识工作中解放,专注于创造力、战略思维和情感连接等机器难以替代的领域。
2025-05-31 08:15:00
936
原创 基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践
RAG技术的价值不仅在于解决LLM的固有缺陷,更在于构建可进化的智能系统——通过持续优化数据管道和提示策略,企业能够以更低成本适应业务需求的快速变化。随着Gemini等多模态模型的迭代,RAG将在更多垂直领域(如智能制造、智慧医疗)释放更大潜力。
2025-05-30 08:15:00
832
原创 AgentOps 时代已来:LLM-D 如何推动企业 AI 从理论走向规模化落地?
AgentOps时代不是即将到来,而是已经到来。现在的问题不再是自治系统是否会改变企业运营,而是谁将引领这一变革并获得巨大利益?对于企业来说,拥抱LLM-D不仅仅是采用一项新技术,更是在人工智能时代抢占战略高地的关键举措。随着分布式推理能力的成熟,代理式人工智能将渗透到企业的各个角落,重新定义运营模式、提升效率,并创造前所未有的价值。
2025-05-29 08:15:00
716
原创 数据提取场景下不同LLM模型对比分析
LLM模型为数据提取带来了革命性的机遇,但同时也带来了诸多挑战。通过深入的对比分析和持续的研究探索,我们能够更好地利用LLM技术,提升数据处理的效率和质量,为数字化时代的发展提供有力支持。
2025-05-28 08:15:00
700
原创 RAG(检索增强生成):提升大语言模型性能的终极指南
RAG的本质,是将检索(Retrieval)与生成(Generation)相结合,让LLMs在回答问题时不再依赖“记忆”,而是通过实时检索外部知识库获取最新信息。
2025-05-27 08:15:00
925
原创 基于 DSPy 与 Pydantic 的自然语言参数提取框架(含code)
参数提取作为自然语言理解(NLU)的基础任务,其本质是从非结构化文本中识别并抽取关键信息,形成符合特定业务逻辑的结构化数据。这一过程不仅是对话系统理解用户意图的“桥梁”,更是自动化系统执行任务的前提。
2025-05-26 08:15:00
2785
原创 LLM中的知识留存:解决LLM的灾难性遗忘问题
灾难性遗忘的本质,是AI在从“专项学习”向“终身学习”跃迁中遭遇的认知瓶颈。从记忆回放的“温故知新”,到PEFT的“模块化生长”,再到元学习的“学习如何学习”,人类正逐步为AI搭建认知脚手架,使其既能在专业领域深耕,又不丢失通用智慧的根基。
2025-05-25 08:15:00
602
原创 LLM的 “自信陷阱”:上下文幻觉如何侵蚀 AI 信任?
大语言模型的出现无疑是人工智能领域的一次重大飞跃,其在信息处理和语言生成方面的能力令人惊叹。然而,上下文幻觉的存在提醒我们,单纯追求“智能”是不够的,AI系统还必须具备“可信”的品质。
2025-05-24 08:15:00
507
原创 2025年GitHub上十大RAG框架深度解析:从技术原理到实战应用
RAG(Retrieval-Augmented Generation)技术通过动态检索外部知识来增强大型语言模型(LLMs)的生成能力,解决了传统LLMs知识截止和“幻觉”风险的问题。其核心流程包括检索、融合和生成,显著提升了生成内容的准确性和可解释性。RAG技术在金融、医疗、电商等领域展现出巨大实用价值,成为构建下一代智能应用的核心技术底座。2025年GitHub上十大RAG框架包括Haystack、RAGFlow、txtai、STORM、LLM-App、Cognita、R2R、Neurite、Flash
2025-05-22 08:15:00
521
原创 如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)
本文探讨了如何构建一个完全本地化的AI智能体,以解决隐私保护和数据主权问题。通过自定义的ModelContextProtocol(MCP)服务器和Llama3.2轻量级模型,实现了知识隔离和工具调用能力。MCP服务器通过只读访问控制、路径隐私保护和协议深度理解,确保数据在本地运行,避免泄露风险。Llama3.2模型因其设备友好性、工具调用支持和性能平衡,成为本地化智能体的理想选择。智能体架构包括MCP客户端与管理器、LLM模型接口和智能体逻辑层,通过工具调用决策与结果处理,实现问答逻辑。实验表明,该方案在知
2025-05-21 08:15:00
1499
1
原创 理解LLM评估指标综述:可靠评估LLM的最佳实践
大语言模型(LLMs)作为强大工具,在众多领域崭露头角。从客户服务、市场营销,到研究和产品开发,大语言模型的应用日益广泛,它们能够简化流程、辅助决策并提升用户体验。然而,能力越大,责任越大。确保这些模型的可靠性、性能和适用性至关重要,而大语言模型评估指标在其中发挥着关键作用。
2025-05-20 08:15:00
891
原创 RAG架构综述:探寻最适配RAG方案
RAG技术通过整合外部知识源检索与模型生成能力,使语言模型能够基于真实世界的信息生成更准确、可靠的回答。如今,RAG技术不断演进,衍生出了多种各具特色的架构类型,每种都针对特定场景和需求进行了优化。
2025-05-19 08:15:00
761
原创 解析LangGraph中的状态、状态图和工作流
状态、状态图和工作流是LangGraph的核心概念。状态作为信息的载体,在工作流执行过程中不断传递和更新;状态图为工作流提供了结构化的设计蓝图,定义了节点、数据流向和状态更新方式;工作流则是状态图的实际运行实例,将状态在状态图规定的路径上推进,实现复杂的AI任务。
2025-05-18 08:15:00
1984
原创 利用大语言模型在Neo4j中构建用于图RAG应用的知识图谱
基于图的RAG与大语言模型的结合不仅仅是一种技术趋势,更是可解释的智能系统的未来发展方向。通过使用大语言模型智能体从原始文本构建知识图谱,并利用Neo4j的强大功能,我们能够从非结构化数据中获得更深入、结构化的见解。
2025-05-17 08:15:00
841
原创 探索LLM引用生成:方法与挑战
在大语言模型(LLM)蓬勃发展的当下,问答系统成为其最广泛的应用场景之一。然而,LLM “幻觉” 的倾向犹如高悬的达摩克利斯之剑,时刻警示着用户不能盲目轻信其回复。为了提升回复的可信度与可解释性,引用机制应运而生,成为增强LLM输出可靠性的关键手段。
2025-05-16 08:15:00
769
原创 突破LLM的token限制:多块上下文保留的实用系统(含code)
大语言模型(LLMs)取得了令人瞩目的进展,已广泛应用于文本生成、翻译、问答等诸多场景。然而,LLMs存在的一些局限性,如有限的上下文窗口(令牌限制)和缺乏长期记忆,限制了其在处理复杂任务时的表现。本文将深入探讨一种实用的解决方案,旨在克服这些限制,提升LLMs的性能。
2025-05-15 08:15:00
906
原创 深入剖析 GraphRAG 的工作原理:步步拆解
GraphRAG本质上是对检索增强生成技术的强化,它借助图结构来优化信息检索和生成过程。与传统RAG不同,GraphRAG能够更好地捕捉数据之间的关系,从而在处理复杂查询时表现出更高的效率和准确性。
2025-05-14 08:15:00
570
原创 探索RAG数据分块策略:工具对比与实践指南(含code)
本文探讨了检索增强生成(RAG)应用中的数据分块策略,重点介绍了LangChain、LlamaIndex和Preprocess三种主流工具的功能与特点。数据分块在RAG中至关重要,合理分块能提升检索效率和生成内容的相关性。LlamaIndex提供固定块大小、语义分块和主题节点解析等策略;LangChain则包括字符文本分割、递归字符文本分割和语义分块;Preprocess则擅长处理复杂文档,提供高质量分块。文章还分析了不同工具在PDF、PPT和Word文档处理中的表现,并建议根据数据类型、应用场景和资源限制
2025-05-13 08:15:00
1569
原创 揭开RAG评估的神秘面纱,让 RAG 评估不再困难(含代码)
检索增强生成(Retrieval-Augmented Generation,RAG)技术近年来备受瞩目。RAG系统结合了信息检索和语言生成的优势,通过从大量文本中检索相关信息来辅助生成高质量的文本内容,广泛应用于问答系统、文档生成等场景。然而,对RAG系统进行准确评估却面临诸多挑战,传统评估方法存在局限性,使得RAG评估犹如一个“黑箱”,难以清晰洞察系统内部的运行机制和性能表现。如何打破这个黑箱,成为当前RAG技术发展中的关键问题。
2025-05-11 08:15:00
922
原创 MicroAgents 框架,如何实现 LLM 工具调用自由?(含代码)
在LLM实际应用中,如何高效地协调多个语言模型智能体,并实现广泛的工具调用,成为了一个亟待解决的关键问题。MicroAgents框架应运而生,它以其轻量级、灵活性强的特性,为这一难题提供了创新的解决方案。
2025-05-10 08:15:00
1309
原创 RASA:LLM系统中实现智能体记忆的认知框架(含代码)
大语言模型(LLMs)和智能体不断进化,已不再局限于简单的响应和输出,而是在推理与行动能力上持续成熟。随着智能体架构的进步,记忆、回忆和知识应用的方式,在系统设计和可信度方面变得愈发关键且复杂。RASA(Role-Aligned Software Architecture,角色对齐软件架构)作为一个创新性的认知框架,为构建具备强大记忆能力、能够灵活适应各种场景的智能体提供了全新的思路和方法。
2025-05-09 08:15:00
953
原创 RAG 中的语义分块:实现更优的上下文检索
语义分块是RAG技术中不可或缺的关键环节。它通过优化文档的分割方式,提升了上下文检索的效果,进而显著提高了RAG系统的性能。随着人工智能技术的不断发展,语义分块技术也将不断演进和完善,为更多领域的应用提供有力支持。
2025-05-07 08:15:00
1891
原创 ReaRAG:教 AI 思考、搜索和自我纠正以获得事实准确答案(含git实现)
ReaRAG作为一种增强事实性的推理模型,通过迭代规划推理步骤并利用外部知识确保推理链的正确性,在多跳问答任务中取得了显著的性能提升。它有效整合了推理模型与外部知识,增强了事实准确性,同时减少了基于强化学习的LRMs中过度思考的问题。
2025-05-06 10:50:57
1070
原创 Agentic RAG:构建能理解、决策和行动的人工智能
Agentic RAG系统的出现,标志着人工智能在理解用户需求、做出智能决策和执行实际行动方面迈出了重要一步。它不仅提升了传统RAG系统的智能化水平,还为众多应用场景带来了更高效、更智能的解决方案。随着技术的不断发展,Agentic RAG有望在更多领域得到应用和拓展,如智能办公、智能医疗、智能教育等。
2025-05-06 10:49:42
1016
原创 结构化输出指南:三个必备prompt提示技巧
当我们尝试将LLM融入到实际的应用程序或工作流程中时,却常常遇到一个棘手的问题——模型输出的信息格式并不总是我们所期望的。它们的回答往往是一段段自由形式的文本,这对于人类理解来说可能足够,但对于代码和自动化系统而言,处理起来却困难重重。这时候,结构化输出(Structured Output)的重要性就凸显出来了。本文将为初学者详细介绍结构化输出的概念、重要性,并深入讲解三个必备的提示技巧,帮助大家更好地从大语言模型中获取可用的结构化数据。
2025-05-04 08:15:00
760
原创 AI Agent评估:指标、策略与最佳实践
AI智能体正逐渐融入到各个领域,从日常的对话助手到复杂的工作流程自动化,其应用范围不断拓展。然而,确保这些智能体能够可靠、高效地完成任务至关重要,这就使得AI智能体评估成为了人工智能发展过程中不可或缺的一环。本文将深入探讨AI智能体评估的指标、策略以及最佳实践,为读者全面解读这一关键领域。
2025-05-03 08:15:00
1114
原创 从零开始构建多源知识图谱提取器:方法、实践与展望(含git链接)
知识图谱通过实体(节点)和关系(边)的形式,将复杂的信息结构化。在搜索引擎中,知识图谱能精准理解用户查询意图,提供更相关的搜索结果;在推荐系统里,依据用户与物品间的关系进行个性化推荐。随着RAG(检索增强生成)应用的普及,知识图谱的重要性愈发凸显,GraphRAG技术借助知识图谱检索扩充大语言模型(LLM)的生成上下文,显著提升RAG系统性能。多源数据包括结构化数据(如数据库表)、半结构化数据(如XML、JSON文件)和非结构化数据(如文本、图像、音频)。
2025-05-02 08:15:00
744
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人