- 博客(382)
- 收藏
- 关注
原创 保姆级教程!手把手带你入门 RAG,从原理到代码实战,建议收藏
本文对比了RAG与AI Agent,详解了RAG检索增强生成的核心流程。文章提供了基于LlamaIndex(千问)和LangChain(DeepSeek)的完整代码实战,涵盖环境配置、依赖安装及示例运行。适合小白入门大模型开发,建议收藏学习。
2026-03-18 21:12:32
493
原创 RAG技术深度解析(二):文档分块与向量化技术详解
> 在上一篇文章中,我们了解了RAG的基本概念和系统架构。本篇将深入离线阶段的两大核心技术——**文档分块**和**向量化**,它们决定了RAG系统检索质量的上限。
2026-03-18 21:11:46
696
原创 LLM智能体进阶指南:智能体记忆机制深度解析
本文指出智能体记忆是通往AGI的核心分水岭。从形式(1D/2D/3D)、功能(事实/技能/工作)及动态演化三维度,深度剖析了记忆系统的底层算法与工程实现。同时揭示了基础设施、中间件及应用层的产业价值,强调掌握记忆机制是构建下一代超级智能的关键。
2026-03-17 21:19:07
493
原创 GraphRAG进阶指南:当RAG遇上知识图谱,从“搜文本”到“搜知识”,大模型开发者必看
传统RAG只能找局部片段,无法回答全局问题。GraphRAG通过LLM构建知识图谱,实现从“搜文本”到“搜知识”的跨越。本文详解其核心原理、主流开源项目(微软、LightRAG等)及落地应用,是大模型开发者进阶必读。
2026-03-17 21:18:14
483
原创 手把手教你创建Coze智能体:小白也能轻松打造专属AI助手
本文详细介绍了在Coze平台上创建智能体的步骤,包括开始创建、选择创建方式(AI创建或标准创建)、自定义配置(如人设、回复、功能模块等)以及发布使用。特别适合编程小白和想要快速入门AI开发的朋友,通过简单操作即可打造属于自己的智能助手,文章还提供了实用的测试和调试建议,帮助读者更好地掌握核心功能。
2026-03-09 21:12:48
440
原创 Coze入门指南:零基础轻松玩转大模型,快来收藏学习!
Coze是一个新一代AI应用开发平台,允许用户无需编程基础,通过拖拽式工作流快速搭建基于大模型的智能体,并发布到社交平台或网站。平台提供灵活的工作流设计、丰富的插件工具、易用的知识库以及持久化记忆能力,支持多种数据源和自定义插件,适合新手和程序员学习使用。
2026-03-09 21:11:33
474
原创 AI Agent技能系统构建全攻略:让智能体从会聊天到会做事
AI Agent Skills是扩展智能体能力的关键,使其从简单对话变为能执行复杂任务的工具。文章详细介绍了技能系统的架构设计,包括技能注册器、定义和执行器,并通过PDF处理和内容创作Agent的实战案例展示了实现方法。同时探讨了动态加载、技能组合、错误处理、权限管理等高级特性,为构建强大的AI Agent提供了全面指导。
2026-02-09 17:03:21
1108
原创 Claude Skills深度解析:从提示词扩展到动态上下文注入
Claude Agent Skills是一种基于提示词的元工具架构,通过动态注入指令而非执行代码来扩展大模型能力。其核心是双重上下文注入机制:对话上下文注入详细指令,执行上下文修改工具权限和模型选择。与传统提示词不同,Skills采用渐进式披露,按需加载专业技能,通过LLM推理而非算法匹配进行决策。这种设计实现了专业知识的模块化、可插拔加载,同时保持上下文效率和安全性,使Claude能够动态转变为特定领域的专家智能体。
2026-02-09 17:02:24
1246
原创 大模型学习必备:14个核心概念详解,建议收藏反复阅读
本文系统梳理了AI大模型的14个核心概念,从基础架构到训练优化,再到前沿应用模式,全面介绍了Transformer架构、Token处理、嵌入模型、混合专家模型、预训练微调、模型对齐、RAG技术、AI Agent等关键技术,帮助读者建立对大模型技术的完整认知框架,理解智能涌现原理及解决关键挑战的方法。
2026-02-07 10:47:33
652
原创 程序员必看:如何像带新员工一样“训练“你的AI智能体
文章通过"新员工"的生动比喻解释了大模型智能体(Agent)的工作原理。智能体如同职场新人,需要通过"系统提示词"了解角色职责,配备"工具"完成工作。其流程是:理解任务→尝试解决→根据反馈优化。开发者需优化提示词、工具和模型来提升智能体表现,使其能更好地处理复杂问题。
2026-02-07 10:46:22
492
原创 大模型应用开发核心技能:RAG技术从入门到精通
文章系统介绍了RAG技术在大模型应用开发中的价值与实现方法,包括核心概念、标准流程、分块策略、检索优化、提示工程和效果评估等关键内容,解决了大模型的领域知识缺乏、幻觉问题等局限,为开发者提供了从理论到实践的全面指导。
2026-02-06 09:20:51
255
原创 AI Agent革命:从“嘴炮王“到“行动派“的效率跨越
文章探讨了AI从"会说话"到"会干活"的革命性跨越,介绍了AI Agent相比传统LLM的三大优势:记忆能力、工具使用能力和目标驱动执行力。重点讲解了MCP协议如何解决API对接问题,以及Agent to Agent协作模式的专业分工力量。通过软件开发、数据分析等实际场景,展示了AI Agent如何从"建议者"转变为"执行者",预言2025年将是AI Agent和MCP的落地年,这将是一场工作方式的革命。
2026-02-06 09:19:07
1388
1
原创 大模型Agent评估全流程详解:开发集、留存集与迭代优化技巧
文章详细介绍了大模型Agent评估的重要性和方法,强调了评估对确保应用稳定性和发现模型边界的关键作用。阐述了评估的四大组成部分(示例输入、标准答案、模型输出、分数),完整的评估流程(开发集与留存集测试),以及三种主要评估方法(代码评分、人工评分、模型评分)。通过情感分析案例展示了如何通过评估迭代优化提示词,最终提升模型性能。构建科学的评估体系是提升大模型应用质量的重要保障。
2026-01-31 14:09:32
841
原创 测试人员必看:大模型不是万能药,这些场景千万别用AI
文章探讨测试领域如何正确应用AI大模型,强调不应盲目追求"全能替代",而应关注长期工程价值。指出MCP、Agent、Skills是不同层级抽象;不适合Agent处理强业务耦合、频繁变更的核心用例;完整脚本生成不值得投入;真正有价值的是将AI用于用例结构化生成、自动化骨架生成等稳定重复环节。测试使用AI的三条原则:判断模糊的不自动化,改动频繁的不Agent化,只用AI干稳定、重复、机械的活。
2026-01-31 14:08:12
867
原创 AI Agent记忆系统完全指南:从入门到精通,解决LLM上下文限制的必备收藏
本文详细介绍了AI Agent记忆系统的概念、分类及实现架构,包括短期记忆的上下文工程策略(压缩、卸载、摘要)和长期记忆的技术架构(记录与检索流程)。文章对比了Google ADK、LangChain和AgentScope等主流框架的记忆系统实现,分析了行业发展趋势,并提供了Mem0等长期记忆组件的集成方案,为构建高效、个性化的AI Agent提供了技术指导。
2026-01-29 18:45:46
1239
转载 保姆级教程:Qwen Code+vLLM+Qwen3-Coder打造纯内网私服级AI编程助手
本文详细介绍了如何通过Qwen Code+vLLM+Qwen3-Coder-30B-A3B-Instruct构建纯内网环境下的私服级开发辅助引擎。内容包括:使用modelscope下载模型,通过vLLM部署API服务,配置Qwen Code组件连接本地模型,以及测试Vibe Coding功能开发H5小游戏和前端页面。文章提供了完整的部署流程、参数配置说明和代码示例,帮助开发者在内网环境中搭建高性能的AI编程助手,提升开发效率。
2026-01-29 18:44:04
1605
原创 测试集发布即失效?2025年大模型技术突破与评估困境
这篇文章总结了2025年大模型领域的关键发展趋势,包括推理模型、RLVR与GRPO技术的兴起,架构效率优化,推理扩展和工具调用的重要性,以及"刷榜"现象带来的评估挑战。同时分析了AI在编程、写作和研究中的应用,以及对2026年的预测,包括RLVR扩展、RAG替代和工具改进等方向。
2026-01-28 17:53:18
631
原创 从GPT-4到智能体:2023-2025大模型架构演进全解析(小白友好)
本文系统梳理了大型语言模型从2023年GPT-4的"唯参数规模论"到2025年多维发展的技术演进。文章详细阐述了效率优化(MoE架构、新型注意力机制)、推理能力(思考链模型、强化学习)和智能体功能三大支柱的形成过程,以及OpenAI、DeepSeek、Anthropic等主流厂商的架构哲学与竞争格局。最后展望了具身智能、后Transformer架构等未来方向,揭示AI正从文本预测器向通用问题解决系统转变的深刻变革。
2026-01-28 17:51:43
920
原创 LLM Agent Skills:提升AI智能体能力的关键架构,小白到进阶必备,建议收藏!
LLM Agent Skills是一种基于提示词的元工具架构,通过封装的专业知识塑造AI智能体的思维模式和解决问题的能力。它采用渐进式披露机制优化Token消耗,提供结构化行为指南解决长周期任务中的鲁棒性问题。Skills与Tools形成互补,前者提供专业知识,后者负责外部执行,共同构成生产级智能体系统的核心架构。
2026-01-22 18:39:45
1090
原创 RAG技术深度解析:LlamaIndex从入门到精通
本文是一篇关于RAG(检索增强生成)技术及LlamaIndex框架的全面教程,从基础原理到实战应用详细讲解。通过《长安的荔枝》案例,展示了如何用不到30行代码构建问答系统,并通过实验分析了chunk_size、top_k等参数对结果的影响。文章还深入解析了LlamaIndex的五层架构和七个核心组件,最后介绍了AgentBay平台,让RAG系统能够执行更复杂的任务,为读者提供了从入门到精通的完整学习路径。
2026-01-22 18:38:31
704
原创 多模态LLM对齐的演进:从CLIP到Qwen3-Omni
从视觉与语言的初步对齐,到跨模态理解与生成的深度融合,多模态大语言模型(Multimodal LLM)的演进正以前所未有的速度重塑人机交互的边界。回溯这一技术脉络,CLIP 首次通过对比学习在海量图文数据中建立起语义对齐的“通用坐标系”,为后续模型奠定了感知基础;
2026-01-14 15:56:51
671
原创 手把手教你搭建RAG系统:从零开始到大模型应用实战
本文详细介绍RAG(检索增强生成)系统,通过手把手教学解决大模型知识冻结和幻觉问题。文章从RAG原理出发,详解数据准备、检索工程和结果生成三大阶段,提供开源技术栈实战代码,并讨论系统局限性。强调在AI项目中,80%时间应投入数据工程和检索策略优化,确保大模型能基于准确资料生成可靠回答。
2026-01-14 15:55:16
633
原创 AI智能体(Agent)全解析+代码示例,程序员必学必收藏
本文全面介绍了AI智能体(Agent)的原理与实现,包括智能体的定义、特征与传统LLM应用的区别,以及构建智能体的三要素(模型、工具、指令)。文章详细讲解了智能体的编排模式(单智能体/多智能体系统)和护栏体系,并通过LangGraph框架提供了最小可运行智能体的代码示例。智能体的本质是执行任务而非简单对话,适合处理模糊性和上下文判断的场景。
2026-01-13 15:15:31
663
原创 RAG技术2025年全面复盘:从检索增强到企业级上下文引擎
文章回顾2025年RAG技术的发展,指出其虽面临争议但企业级地位更加稳固。RAG正从"检索增强生成"演进为"上下文引擎",通过TreeRAG、GraphRAG等架构优化解决语义碎片化问题。在AI Agent时代,RAG作为数据底座的重要性凸显,未来将向多模态支持、自动化上下文组装方向发展,成为企业智能化基础设施的关键组件
2026-01-13 15:14:37
464
原创 大模型突破“玻璃杯中之脑“:MCP如何让AI真正连接物理世界
大模型正从"智力内卷"转向"基础设施交接",通过MCP协议实现与物理世界的连接。MCP作为"万能USB接口",经历了从只读到工具调用再到感官流打通的进化,使大模型拥有了"手"、"眼"、"耳"。这种架构逆转让大模型成为客户端,物理设备成为服务端,实现"专家会诊"模式。未来,App将弱化为底层接口,人类通过Agent直接调度后端能力,大模型的终点是真正"连接世界"。
2026-01-08 11:01:54
684
原创 RAG分块完全指南:7种核心策略详解,让你的大模型效果翻倍
本文详解RAG系统中分块(Chunking)策略这一关键环节,解析了7种主流分块方法:固定大小、语义、递归、文档、智能体、句子和段落分块。文章指出不存在"万能"策略,建议从512 tokens搭配10-15%重叠率开始,通过调试参数优化,优先考虑递归分块和句子分块。正确选择分块策略能显著提升RAG系统检索准确性和生成质量,是构建高效大模型应用的重要基础。
2026-01-07 17:49:38
1075
原创 参数高效微调三剑客:LoRA、MoLoRA与MoR1E的深度比较与应用指南
在大型语言模型(LLM)时代,全参数微调(Full Fine-tuning)面临**三大挑战**:1. **计算资源消耗**:微调百亿参数模型需昂贵GPU集群2. **存储开销**:每个下游任务需保存完整模型副本3. **灾难性遗忘**:微调可能损害模型原有通用能力
2026-01-07 17:48:39
1011
原创 Dify+LangGraph实战:零基础构建多智能体系统,代码与可视化完美融合
本文探讨低代码平台Dify与专业编排框架LangGraph的融合,介绍LangGraph核心特性如持久化执行、人机交互等,以及"编排代码化,实现可视化"的集成思想。通过对话分析多智能体系统实战案例,展示这种融合如何提升开发效率、编排灵活性和系统可靠性,为AI应用开发提供全新路径。
2025-12-31 18:11:14
793
原创 2025年AI Agent全面指南:从入门到精通,掌握大模型智能体开发与评测
文章全面分析了AI Agent的定义、能力水平划分(L0-L5)、模态分类和应用场景。重点探讨了Agent的核心架构、Plan模块(任务分解、反思和提炼)以及评测体系,并对多个开源项目(Dify、langflow、MetaGPT等)进行了深度评测。指出当前Agent项目主要集中在流程编排阶段(L2),未来将朝着多模态、个性化和群体智能方向发展,为开发者提供了全面的Agent开发参考。
2025-12-31 18:10:14
1342
原创 AI能认识你吗?RAG/微调/提示工程三大核心技术详解,程序员必学,建议收藏
文章探讨了AI对用户的认识程度,介绍了三种提升AI回答准确性的方法:RAG(检索增强生成)、Fine-tuning(微调)和Prompt Engineering(提示工程)。RAG通过检索实时信息增强回答,Fine-tuning让模型深度学习特定领域知识,Prompt Engineering则是优化提问方式。文章分析了三种方法的原理、优缺点及适用场景,建议根据需求选择合适方法或组合使用,以更好地驾驭AI工具。
2025-12-23 15:35:58
512
原创 RAG知识库构建核心:告别一刀切!文档处理实战指南,程序员必看收藏
本文强调RAG系统中文档处理的重要性,指出没有放之四海而皆准的标准方法。知识库构建的核心是优化检索能力而非简单拆分文档。针对结构化数据应提取元数据,非结构化数据需合理分段并保留核心内容。文档清洗至关重要,需过滤无效内容和脏数据。最终处理方式应根据具体业务需求灵活调整,而非机械照搬流程,才能提升知识库质量和系统表现。
2025-12-23 15:35:14
418
原创 智能体(Agent)开发指南:从基础概念到主流框架实现
文章全面介绍了智能体(Agent)的核心概念、架构设计与实现方法,以及主流框架对比。内容包括智能体基础理论(PEAS模型、智能体循环、提示工程)、与传统工作流的区别、模型参数调优方法、核心架构(ReAct、Plan-and-Solve、Reflection)和主流框架(AutoGen、AgentScope等)分析,以及低代码开发平台和本地推理工具介绍。旨在帮助开发者构建高性能智能体系统。
2025-12-20 16:05:56
728
原创 揭秘AI Agent的自我反馈机制:让代码像人类一样不断优化
本文介绍了AI Agent的自我反馈机制,通过双智能体架构(生成智能体与验证智能体)实现代码的持续优化。反射协调器控制反思循环,设置质量阈值、迭代限制等条件确保高效退出。案例展示了一款质数过滤函数如何从初版65分优化至92分,体现了AI从"执行工具"到"学习实体"的进化。这一机制使AI具备元认知能力,在不依赖人类反馈的情况下自主改进,标志着AI能力的重要跃迁。
2025-12-20 16:05:06
804
原创 大模型全栈学习指南:理论到实战,一步到位
文章推荐了DataWhale开源的从NLP到大语言模型的全栈教程,分为理论、实战、微调量化和应用部署四部分。教程从NLP基础开始,逐步深入到Transformer架构和预训练模型,通过文本分类和命名实体识别等实战项目巩固知识,最后讲解微调技术和模型部署方法。该教程全面系统,适合新手快速构建大模型知识框架,为进入50W+薪资的大模型算法岗位做准备。
2025-12-19 19:01:01
336
原创 掌握提示工程:CoT思维链技术详解,零样本学习替代数据标注
提示工程是设计与大模型交互的核心技能,特别是Chain-of-Thought(CoT)技术通过引导模型展示推理过程,能显著降低对标注数据的依赖。无需微调,即可通过零样本/少样本提示让基座模型表现出接近微调模型的性能。文章系统介绍了提示工程流程:任务分析、提示设计模式选择、迭代评估和工具集成,以及角色扮演、格式约束等高级技巧,帮助开发者将人类思维模式"翻译"成模型可执行的指令,实现经济高效、透明可解释的大模型应用。
2025-12-18 18:27:46
1059
原创 2025年底,我们用什么框架来开发智能体?
如果说 2024 年是“大模型应用”的元年,那么 2025 年无疑是 **“智能体(Agents)”** 的爆发之年。AI 正在从对话助手演变为能自主执行任务的智能体。从年初的 Prompt Engineering,到年中的 RAG,再到现在,Agent 已成为每个开发者的必修课。但问题也随之而来:**框架太多了。**
2025-12-16 18:38:16
983
原创 RAG分块完全指南:提升大模型检索准确率的5大策略详解
RAG技术通过分块策略解决大模型在企业应用中的局限性。文章详细分析了五种分块策略:固定大小分块实现简单但易语义断裂;语义分块保证内容完整但计算复杂;递归分块适应长文档但块大小不均;基于文档结构的分块保留逻辑但依赖格式;基于LLM的分块智能化但成本高。针对不同场景,如金融、医疗等高风险领域,应选择合适的分块策略或组合使用,以提高检索准确性、降低幻觉风险,并解决复杂文档解析瓶颈问题。
2025-12-12 18:14:59
1009
原创 从零开始构建Agent记忆系统:LangGraph长短期记忆实战指南
本文深入探讨Agent Memory的核心概念,详解LangGraph框架下短期会话与长期记忆的实现机制,包括存储管理、语义检索等技术。通过MCP协议实战案例,手把手构建融合长记忆机制的Multi-Agent系统,展示中断处理、记忆协作等高级功能。文章提供完整代码示例,帮助开发者掌握记忆管理策略,打造具有上下文感知能力的智能体系统。
2025-12-11 17:59:32
1113
原创 大模型微调技术:从全科医生到专科专家的完整指南
本文详细介绍了大模型微调(Fine-tuning)的概念、原理及三种主要方法:全参数微调(性能最佳但成本高)、部分参数微调(折中方案)和参数高效微调(PEFT,当前主流选择)。PEFT技术包括Additive(添加新参数)、Selective(选择性训练参数)和Reparametrization-based(如LoRA)三大范式,让小型团队也能高效定制大模型。未来趋势是进一步降低参数量、增强框架灵活性、拓展多模态应用,并优化边缘部署能力。
2025-12-11 17:58:20
645
原创 深入理解LLM大语言模型,从入门到精通(建议收藏)
本文从基础定义、技术原理(预训练、后训练、强化学习)到实用技巧全面解析大语言模型(LLM)。预训练阶段通过互联网数据训练基础模型;后训练将模型转变为对话助手;强化学习优化输出质量。文章探讨幻觉问题、思维链等关键概念,并提供use code等实用技巧,帮助读者理解LLM工作原理和应用方法。
2025-12-10 17:30:09
302
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅