大模型工程师老蓝-CSDN博客

原创保姆级教程！手把手带你入门 RAG，从原理到代码实战，建议收藏

本文对比了RAG与AI Agent，详解了RAG检索增强生成的核心流程。文章提供了基于LlamaIndex（千问）和LangChain（DeepSeek）的完整代码实战，涵盖环境配置、依赖安装及示例运行。适合小白入门大模型开发，建议收藏学习。

2026-03-18 21:12:32 493

原创 RAG技术深度解析（二）：文档分块与向量化技术详解

> 在上一篇文章中，我们了解了RAG的基本概念和系统架构。本篇将深入离线阶段的两大核心技术——**文档分块**和**向量化**，它们决定了RAG系统检索质量的上限。

2026-03-18 21:11:46 696

原创 LLM智能体进阶指南：智能体记忆机制深度解析

本文指出智能体记忆是通往AGI的核心分水岭。从形式（1D/2D/3D）、功能（事实/技能/工作）及动态演化三维度，深度剖析了记忆系统的底层算法与工程实现。同时揭示了基础设施、中间件及应用层的产业价值，强调掌握记忆机制是构建下一代超级智能的关键。

2026-03-17 21:19:07 493

原创 GraphRAG进阶指南：当RAG遇上知识图谱，从“搜文本”到“搜知识”，大模型开发者必看

传统RAG只能找局部片段，无法回答全局问题。GraphRAG通过LLM构建知识图谱，实现从“搜文本”到“搜知识”的跨越。本文详解其核心原理、主流开源项目（微软、LightRAG等）及落地应用，是大模型开发者进阶必读。

2026-03-17 21:18:14 483

原创手把手教你创建Coze智能体：小白也能轻松打造专属AI助手

本文详细介绍了在Coze平台上创建智能体的步骤，包括开始创建、选择创建方式（AI创建或标准创建）、自定义配置（如人设、回复、功能模块等）以及发布使用。特别适合编程小白和想要快速入门AI开发的朋友，通过简单操作即可打造属于自己的智能助手，文章还提供了实用的测试和调试建议，帮助读者更好地掌握核心功能。

2026-03-09 21:12:48 440

原创 Coze入门指南：零基础轻松玩转大模型，快来收藏学习！

Coze是一个新一代AI应用开发平台，允许用户无需编程基础，通过拖拽式工作流快速搭建基于大模型的智能体，并发布到社交平台或网站。平台提供灵活的工作流设计、丰富的插件工具、易用的知识库以及持久化记忆能力，支持多种数据源和自定义插件，适合新手和程序员学习使用。

2026-03-09 21:11:33 474

原创 AI Agent技能系统构建全攻略：让智能体从会聊天到会做事

AI Agent Skills是扩展智能体能力的关键，使其从简单对话变为能执行复杂任务的工具。文章详细介绍了技能系统的架构设计，包括技能注册器、定义和执行器，并通过PDF处理和内容创作Agent的实战案例展示了实现方法。同时探讨了动态加载、技能组合、错误处理、权限管理等高级特性，为构建强大的AI Agent提供了全面指导。

2026-02-09 17:03:21 1108

原创 Claude Skills深度解析：从提示词扩展到动态上下文注入

Claude Agent Skills是一种基于提示词的元工具架构，通过动态注入指令而非执行代码来扩展大模型能力。其核心是双重上下文注入机制：对话上下文注入详细指令，执行上下文修改工具权限和模型选择。与传统提示词不同，Skills采用渐进式披露，按需加载专业技能，通过LLM推理而非算法匹配进行决策。这种设计实现了专业知识的模块化、可插拔加载，同时保持上下文效率和安全性，使Claude能够动态转变为特定领域的专家智能体。

2026-02-09 17:02:24 1246

原创大模型学习必备：14个核心概念详解，建议收藏反复阅读

本文系统梳理了AI大模型的14个核心概念，从基础架构到训练优化，再到前沿应用模式，全面介绍了Transformer架构、Token处理、嵌入模型、混合专家模型、预训练微调、模型对齐、RAG技术、AI Agent等关键技术，帮助读者建立对大模型技术的完整认知框架，理解智能涌现原理及解决关键挑战的方法。

2026-02-07 10:47:33 652

原创程序员必看：如何像带新员工一样“训练“你的AI智能体

文章通过"新员工"的生动比喻解释了大模型智能体(Agent)的工作原理。智能体如同职场新人，需要通过"系统提示词"了解角色职责，配备"工具"完成工作。其流程是：理解任务→尝试解决→根据反馈优化。开发者需优化提示词、工具和模型来提升智能体表现，使其能更好地处理复杂问题。

2026-02-07 10:46:22 492

原创大模型应用开发核心技能：RAG技术从入门到精通

文章系统介绍了RAG技术在大模型应用开发中的价值与实现方法，包括核心概念、标准流程、分块策略、检索优化、提示工程和效果评估等关键内容，解决了大模型的领域知识缺乏、幻觉问题等局限，为开发者提供了从理论到实践的全面指导。

2026-02-06 09:20:51 255

原创 AI Agent革命：从“嘴炮王“到“行动派“的效率跨越

文章探讨了AI从"会说话"到"会干活"的革命性跨越，介绍了AI Agent相比传统LLM的三大优势：记忆能力、工具使用能力和目标驱动执行力。重点讲解了MCP协议如何解决API对接问题，以及Agent to Agent协作模式的专业分工力量。通过软件开发、数据分析等实际场景，展示了AI Agent如何从"建议者"转变为"执行者"，预言2025年将是AI Agent和MCP的落地年，这将是一场工作方式的革命。

2026-02-06 09:19:07 1388 1

原创大模型Agent评估全流程详解：开发集、留存集与迭代优化技巧

文章详细介绍了大模型Agent评估的重要性和方法，强调了评估对确保应用稳定性和发现模型边界的关键作用。阐述了评估的四大组成部分（示例输入、标准答案、模型输出、分数），完整的评估流程（开发集与留存集测试），以及三种主要评估方法（代码评分、人工评分、模型评分）。通过情感分析案例展示了如何通过评估迭代优化提示词，最终提升模型性能。构建科学的评估体系是提升大模型应用质量的重要保障。

2026-01-31 14:09:32 841

原创测试人员必看：大模型不是万能药，这些场景千万别用AI

文章探讨测试领域如何正确应用AI大模型，强调不应盲目追求"全能替代"，而应关注长期工程价值。指出MCP、Agent、Skills是不同层级抽象；不适合Agent处理强业务耦合、频繁变更的核心用例；完整脚本生成不值得投入；真正有价值的是将AI用于用例结构化生成、自动化骨架生成等稳定重复环节。测试使用AI的三条原则：判断模糊的不自动化，改动频繁的不Agent化，只用AI干稳定、重复、机械的活。

2026-01-31 14:08:12 867

原创 AI Agent记忆系统完全指南：从入门到精通，解决LLM上下文限制的必备收藏

本文详细介绍了AI Agent记忆系统的概念、分类及实现架构，包括短期记忆的上下文工程策略（压缩、卸载、摘要）和长期记忆的技术架构（记录与检索流程）。文章对比了Google ADK、LangChain和AgentScope等主流框架的记忆系统实现，分析了行业发展趋势，并提供了Mem0等长期记忆组件的集成方案，为构建高效、个性化的AI Agent提供了技术指导。

2026-01-29 18:45:46 1239

转载保姆级教程：Qwen Code+vLLM+Qwen3-Coder打造纯内网私服级AI编程助手

本文详细介绍了如何通过Qwen Code+vLLM+Qwen3-Coder-30B-A3B-Instruct构建纯内网环境下的私服级开发辅助引擎。内容包括：使用modelscope下载模型，通过vLLM部署API服务，配置Qwen Code组件连接本地模型，以及测试Vibe Coding功能开发H5小游戏和前端页面。文章提供了完整的部署流程、参数配置说明和代码示例，帮助开发者在内网环境中搭建高性能的AI编程助手，提升开发效率。

2026-01-29 18:44:04 1605

原创测试集发布即失效？2025年大模型技术突破与评估困境

这篇文章总结了2025年大模型领域的关键发展趋势，包括推理模型、RLVR与GRPO技术的兴起，架构效率优化，推理扩展和工具调用的重要性，以及"刷榜"现象带来的评估挑战。同时分析了AI在编程、写作和研究中的应用，以及对2026年的预测，包括RLVR扩展、RAG替代和工具改进等方向。

2026-01-28 17:53:18 631

原创从GPT-4到智能体：2023-2025大模型架构演进全解析（小白友好）

本文系统梳理了大型语言模型从2023年GPT-4的"唯参数规模论"到2025年多维发展的技术演进。文章详细阐述了效率优化（MoE架构、新型注意力机制）、推理能力（思考链模型、强化学习）和智能体功能三大支柱的形成过程，以及OpenAI、DeepSeek、Anthropic等主流厂商的架构哲学与竞争格局。最后展望了具身智能、后Transformer架构等未来方向，揭示AI正从文本预测器向通用问题解决系统转变的深刻变革。

2026-01-28 17:51:43 920

原创 LLM Agent Skills：提升AI智能体能力的关键架构，小白到进阶必备，建议收藏！

LLM Agent Skills是一种基于提示词的元工具架构，通过封装的专业知识塑造AI智能体的思维模式和解决问题的能力。它采用渐进式披露机制优化Token消耗，提供结构化行为指南解决长周期任务中的鲁棒性问题。Skills与Tools形成互补，前者提供专业知识，后者负责外部执行，共同构成生产级智能体系统的核心架构。

2026-01-22 18:39:45 1090

原创 RAG技术深度解析：LlamaIndex从入门到精通

本文是一篇关于RAG（检索增强生成）技术及LlamaIndex框架的全面教程，从基础原理到实战应用详细讲解。通过《长安的荔枝》案例，展示了如何用不到30行代码构建问答系统，并通过实验分析了chunk_size、top_k等参数对结果的影响。文章还深入解析了LlamaIndex的五层架构和七个核心组件，最后介绍了AgentBay平台，让RAG系统能够执行更复杂的任务，为读者提供了从入门到精通的完整学习路径。

2026-01-22 18:38:31 704

原创多模态LLM对齐的演进：从CLIP到Qwen3-Omni

从视觉与语言的初步对齐，到跨模态理解与生成的深度融合，多模态大语言模型（Multimodal LLM）的演进正以前所未有的速度重塑人机交互的边界。回溯这一技术脉络，CLIP 首次通过对比学习在海量图文数据中建立起语义对齐的“通用坐标系”，为后续模型奠定了感知基础；

2026-01-14 15:56:51 671

原创手把手教你搭建RAG系统：从零开始到大模型应用实战

本文详细介绍RAG（检索增强生成）系统，通过手把手教学解决大模型知识冻结和幻觉问题。文章从RAG原理出发，详解数据准备、检索工程和结果生成三大阶段，提供开源技术栈实战代码，并讨论系统局限性。强调在AI项目中，80%时间应投入数据工程和检索策略优化，确保大模型能基于准确资料生成可靠回答。

2026-01-14 15:55:16 633

原创 AI智能体(Agent)全解析+代码示例，程序员必学必收藏

本文全面介绍了AI智能体(Agent)的原理与实现，包括智能体的定义、特征与传统LLM应用的区别，以及构建智能体的三要素(模型、工具、指令)。文章详细讲解了智能体的编排模式(单智能体/多智能体系统)和护栏体系，并通过LangGraph框架提供了最小可运行智能体的代码示例。智能体的本质是执行任务而非简单对话，适合处理模糊性和上下文判断的场景。

2026-01-13 15:15:31 663

原创 RAG技术2025年全面复盘：从检索增强到企业级上下文引擎

文章回顾2025年RAG技术的发展，指出其虽面临争议但企业级地位更加稳固。RAG正从"检索增强生成"演进为"上下文引擎"，通过TreeRAG、GraphRAG等架构优化解决语义碎片化问题。在AI Agent时代，RAG作为数据底座的重要性凸显，未来将向多模态支持、自动化上下文组装方向发展，成为企业智能化基础设施的关键组件

2026-01-13 15:14:37 464

原创大模型突破“玻璃杯中之脑“：MCP如何让AI真正连接物理世界

大模型正从"智力内卷"转向"基础设施交接"，通过MCP协议实现与物理世界的连接。MCP作为"万能USB接口"，经历了从只读到工具调用再到感官流打通的进化，使大模型拥有了"手"、"眼"、"耳"。这种架构逆转让大模型成为客户端，物理设备成为服务端，实现"专家会诊"模式。未来，App将弱化为底层接口，人类通过Agent直接调度后端能力，大模型的终点是真正"连接世界"。

2026-01-08 11:01:54 684

原创 RAG分块完全指南：7种核心策略详解，让你的大模型效果翻倍

本文详解RAG系统中分块(Chunking)策略这一关键环节，解析了7种主流分块方法：固定大小、语义、递归、文档、智能体、句子和段落分块。文章指出不存在"万能"策略，建议从512 tokens搭配10-15%重叠率开始，通过调试参数优化，优先考虑递归分块和句子分块。正确选择分块策略能显著提升RAG系统检索准确性和生成质量，是构建高效大模型应用的重要基础。

2026-01-07 17:49:38 1075

原创参数高效微调三剑客：LoRA、MoLoRA与MoR1E的深度比较与应用指南

在大型语言模型(LLM)时代，全参数微调(Full Fine-tuning)面临**三大挑战**：1. **计算资源消耗**：微调百亿参数模型需昂贵GPU集群2. **存储开销**：每个下游任务需保存完整模型副本3. **灾难性遗忘**：微调可能损害模型原有通用能力

2026-01-07 17:48:39 1011

原创 Dify+LangGraph实战：零基础构建多智能体系统，代码与可视化完美融合

本文探讨低代码平台Dify与专业编排框架LangGraph的融合，介绍LangGraph核心特性如持久化执行、人机交互等，以及"编排代码化，实现可视化"的集成思想。通过对话分析多智能体系统实战案例，展示这种融合如何提升开发效率、编排灵活性和系统可靠性，为AI应用开发提供全新路径。

2025-12-31 18:11:14 793

原创 2025年AI Agent全面指南：从入门到精通，掌握大模型智能体开发与评测

文章全面分析了AI Agent的定义、能力水平划分（L0-L5）、模态分类和应用场景。重点探讨了Agent的核心架构、Plan模块（任务分解、反思和提炼）以及评测体系，并对多个开源项目（Dify、langflow、MetaGPT等）进行了深度评测。指出当前Agent项目主要集中在流程编排阶段（L2），未来将朝着多模态、个性化和群体智能方向发展，为开发者提供了全面的Agent开发参考。

2025-12-31 18:10:14 1342

原创 AI能认识你吗？RAG/微调/提示工程三大核心技术详解，程序员必学，建议收藏

文章探讨了AI对用户的认识程度，介绍了三种提升AI回答准确性的方法：RAG(检索增强生成)、Fine-tuning(微调)和Prompt Engineering(提示工程)。RAG通过检索实时信息增强回答，Fine-tuning让模型深度学习特定领域知识，Prompt Engineering则是优化提问方式。文章分析了三种方法的原理、优缺点及适用场景，建议根据需求选择合适方法或组合使用，以更好地驾驭AI工具。

2025-12-23 15:35:58 512

原创 RAG知识库构建核心：告别一刀切！文档处理实战指南，程序员必看收藏

本文强调RAG系统中文档处理的重要性，指出没有放之四海而皆准的标准方法。知识库构建的核心是优化检索能力而非简单拆分文档。针对结构化数据应提取元数据，非结构化数据需合理分段并保留核心内容。文档清洗至关重要，需过滤无效内容和脏数据。最终处理方式应根据具体业务需求灵活调整，而非机械照搬流程，才能提升知识库质量和系统表现。

2025-12-23 15:35:14 418

原创智能体(Agent)开发指南：从基础概念到主流框架实现

文章全面介绍了智能体(Agent)的核心概念、架构设计与实现方法，以及主流框架对比。内容包括智能体基础理论(PEAS模型、智能体循环、提示工程)、与传统工作流的区别、模型参数调优方法、核心架构(ReAct、Plan-and-Solve、Reflection)和主流框架(AutoGen、AgentScope等)分析，以及低代码开发平台和本地推理工具介绍。旨在帮助开发者构建高性能智能体系统。

2025-12-20 16:05:56 728

原创揭秘AI Agent的自我反馈机制：让代码像人类一样不断优化

本文介绍了AI Agent的自我反馈机制，通过双智能体架构（生成智能体与验证智能体）实现代码的持续优化。反射协调器控制反思循环，设置质量阈值、迭代限制等条件确保高效退出。案例展示了一款质数过滤函数如何从初版65分优化至92分，体现了AI从"执行工具"到"学习实体"的进化。这一机制使AI具备元认知能力，在不依赖人类反馈的情况下自主改进，标志着AI能力的重要跃迁。

2025-12-20 16:05:06 804

原创大模型全栈学习指南：理论到实战，一步到位

文章推荐了DataWhale开源的从NLP到大语言模型的全栈教程，分为理论、实战、微调量化和应用部署四部分。教程从NLP基础开始，逐步深入到Transformer架构和预训练模型，通过文本分类和命名实体识别等实战项目巩固知识，最后讲解微调技术和模型部署方法。该教程全面系统，适合新手快速构建大模型知识框架，为进入50W+薪资的大模型算法岗位做准备。

2025-12-19 19:01:01 336

原创掌握提示工程：CoT思维链技术详解，零样本学习替代数据标注

提示工程是设计与大模型交互的核心技能，特别是Chain-of-Thought(CoT)技术通过引导模型展示推理过程，能显著降低对标注数据的依赖。无需微调，即可通过零样本/少样本提示让基座模型表现出接近微调模型的性能。文章系统介绍了提示工程流程：任务分析、提示设计模式选择、迭代评估和工具集成，以及角色扮演、格式约束等高级技巧，帮助开发者将人类思维模式"翻译"成模型可执行的指令，实现经济高效、透明可解释的大模型应用。

2025-12-18 18:27:46 1059

原创 2025年底，我们用什么框架来开发智能体？

如果说 2024 年是“大模型应用”的元年，那么 2025 年无疑是 **“智能体（Agents）”** 的爆发之年。AI 正在从对话助手演变为能自主执行任务的智能体。从年初的 Prompt Engineering，到年中的 RAG，再到现在，Agent 已成为每个开发者的必修课。但问题也随之而来：**框架太多了。**

2025-12-16 18:38:16 983

原创 RAG分块完全指南：提升大模型检索准确率的5大策略详解

RAG技术通过分块策略解决大模型在企业应用中的局限性。文章详细分析了五种分块策略：固定大小分块实现简单但易语义断裂；语义分块保证内容完整但计算复杂；递归分块适应长文档但块大小不均；基于文档结构的分块保留逻辑但依赖格式；基于LLM的分块智能化但成本高。针对不同场景，如金融、医疗等高风险领域，应选择合适的分块策略或组合使用，以提高检索准确性、降低幻觉风险，并解决复杂文档解析瓶颈问题。

2025-12-12 18:14:59 1009

原创从零开始构建Agent记忆系统：LangGraph长短期记忆实战指南

本文深入探讨Agent Memory的核心概念，详解LangGraph框架下短期会话与长期记忆的实现机制，包括存储管理、语义检索等技术。通过MCP协议实战案例，手把手构建融合长记忆机制的Multi-Agent系统，展示中断处理、记忆协作等高级功能。文章提供完整代码示例，帮助开发者掌握记忆管理策略，打造具有上下文感知能力的智能体系统。

2025-12-11 17:59:32 1113

原创大模型微调技术：从全科医生到专科专家的完整指南

本文详细介绍了大模型微调(Fine-tuning)的概念、原理及三种主要方法：全参数微调（性能最佳但成本高）、部分参数微调（折中方案）和参数高效微调(PEFT，当前主流选择)。PEFT技术包括Additive（添加新参数）、Selective（选择性训练参数）和Reparametrization-based（如LoRA）三大范式，让小型团队也能高效定制大模型。未来趋势是进一步降低参数量、增强框架灵活性、拓展多模态应用，并优化边缘部署能力。

2025-12-11 17:58:20 645

原创深入理解LLM大语言模型，从入门到精通（建议收藏）

本文从基础定义、技术原理(预训练、后训练、强化学习)到实用技巧全面解析大语言模型(LLM)。预训练阶段通过互联网数据训练基础模型；后训练将模型转变为对话助手；强化学习优化输出质量。文章探讨幻觉问题、思维链等关键概念，并提供use code等实用技巧，帮助读者理解LLM工作原理和应用方法。

2025-12-10 17:30:09 302

空空如也

空空如也