小敢摘葡萄-CSDN博客

原创 Agentic入门实战_01｜Agent基础认知与大模型知识

Agent（智能体）作为连接大模型与实际业务场景的核心载体，正成为AI应用开发的重要方向。从简单的对话机器人到复杂的自主决策系统，Agent的核心价值在于实现感知-思考-行动的智能闭环，而大语言模型（LLM）则为Agent赋予了真正的“思考”能力。本文将从Agent的基础定义出发，理清其核心特征与发展演进，同时结合实战代码，讲解基于主流接口规范的大模型调用方法，为 Agentic 开发打下基础。能够通过传感器感知所处环境，自主通过执行器采取行动，以达成特定目标的实体。感知（Sensors）

2026-03-05 11:51:52 9

原创从DeepSeek到Seedance_2.0，国产大模型杀疯了！

中国AI大模型行业在短短三天内经历跃迁式发展，Seedance 2.0、Qwen-Image 2.0、MiniMax M2.5、DeepSeek百万Token模型及开源GLM-5等相继问世。厂商策略从参数竞赛转向解决实际问题，聚焦内容创作、效率提升与工程执行。国产大模型依托完善的产业链、算力平台、应用场景及政策支持，展现出从追赶走向突围的趋势，标志着AI技术正从实验室走向生产实际，为资源创造新价值。AI的进化，从来不是缓慢爬坡，而是突然跃迁。春节前三天，中国大模型行业就经历了这样一次跃迁。

2026-03-04 15:47:52 172

原创 AI大模型排名大洗牌！谁才是最强AI

SuperCLUE评测通过数学推理、科学推理、代码生成等6大任务评估大模型能力，涵盖推理与应用。评测包含998道新题，测评34个模型，提供综合排名与智能指数。文章还分析了生成耗时与模型价格，帮助读者全面了解模型性能与经济性，是学习大模型应用的必备资料。| 前言SuperCLUE年度测评涵盖了数学推理、科学推理、代码生成、精确指令遵循、幻觉控制、智能体(任务规划)六大任务，其中数学推理、科学推理、代码生成为推理能力，精确指令遵循、幻觉控制、智能体(任务规划)为应用能力。

2026-03-04 13:55:38 253

原创 Agent智能体（超详细）从入门到精通，一篇搞定必收藏！

文章探讨了Agent智能体的定义、优势、挑战及开发价值。作者分析Agent作为"代理/模拟"人类行为的能力，强调其在降低开发门槛、简化流程复杂度、提供多样化交互和协同完成任务方面的优势。尽管存在速度慢、幻觉等挑战，但通过技术创新这些问题正被逐步解决，Agent代表生产力解放方向，值得长期投入。阿里妹导读作者通过深入分析、理解、归纳，最后解答了“为什么一定要做Agent”这个问题。

2026-02-16 09:45:00 1504

原创 8种RAG架构浅析！从零基础入门到精通，一篇就够了！

Naive RAG 是最基础的检索增强生成架构，采用“索引-检索-生成”的经典流程。

2026-02-14 10:00:00 646

原创一文读懂_MCP、RAG、Agent，从小白到专家，一篇就搞定！

最近，AI 圈被三个词刷屏了 ——MCP、RAG、Agent！几乎每天都有新的相关工具冒出来，各大技术论坛、行业群聊得热火朝天。但不少朋友一看到这些术语就犯迷糊：它们到底是啥？能干啥？和我们普通人又有啥关系？别慌！今天就用最接地气的方式，带你彻底搞懂这些概念，看完秒变 AI 达人！

2026-02-12 12:45:00 580

原创从0到1搞懂大模型：10张图轻松讲明白LLM、RAG、Agent

本文通过10张图和生动的生活比喻，帮助大人向孩子解释AI的核心概念。每张图聚焦一个关键问题，涵盖大模型、Token、上下文窗口、提示词、Transformer、RAG、Agent、Embedding、幻觉与温度、安全等核心概念。文章不仅解释了AI的基本原理和工作方式，还提供了"万能提示词模板"，帮助读者正确理解和使用AI技术，避免常见误区。寒假在家，估计AI一定是会讨论的话题，如果孩子突然来一句：“AI到底是什么？你可能下意识想回答“就是很聪明的软件？

2026-02-12 09:15:00 1241

原创 Agent开发教程（超详细）从零基础到精通，收藏这一篇就够了！

本文针对长周期Agent落地中的上下文丢失和任务完成误判问题，提出三大解决方案：双Agent架构实现任务拆解与增量开发；基于Milvus向量数据库的语义检索机制保障跨会话状态恢复；测试驱动的端到端验证确保功能完整可用。通过LangGraph和Milvus协同工作，构建"短期记忆+长期记忆"系统，使Agent能可靠完成复杂长周期任务。

2026-02-09 11:47:04 842

原创 LangChain构建多智能体的具体实现方式

文章介绍了多智能体系统(MAS)的概念和在LangChain中的五种实现模式，包括Subagents、Handoffs、Skills、Router和Custom workflow，并通过两个实际案例展示了如何构建搜索智能体。多智能体系统通过群体智能突破单智能体能力边界，适合处理复杂、动态任务，但并非所有问题都需要多智能体，许多可通过优化提示和工具调用解决。

2026-02-09 11:11:26 635

原创智能客服Agent全攻略（非常详细）从设计理念到工程落地，收藏这篇就够了！

文章介绍智能客服Agent的设计哲学与实现方法，强调"拒绝闲聊，追求收敛"的核心理念。详细阐述风险分层架构设计、三层状态管理模型（业务状态、对话状态、语义状态）、模糊意图处理策略，以及工程化交付标准。指出优秀的客服Agent是严谨的业务工作流AI智能体系统，而非简单聊天机器人，需通过可观测性、兜底机制和SLA保障确保系统稳定性。大家好，我是玄姐。

2026-02-09 11:05:31 638

原创 AI大模型记忆系统教程（超详细）从零基础入门到精通，一篇就够了！

文章介绍了MemOS智能体记忆开源项目，重点展示了其基于Graph的记忆"图谱"能力，包括记忆存储、检索和自动重组功能。详细讲解了如何通过Middleware机制将MemOS集成到LangChain框架，实现无侵入式记忆增强，赋予AI Agent长期记忆与知识积累能力，超越会话级上下文管理限制。MemOS 是一款具有独特设计理念的智能体记忆（Memory）开源项目。

2026-02-05 20:19:06 648

原创 AI大模型教程（超详细）从稀疏神经网络到可解释AI，收藏这篇就够了！

破解大模型「黑箱」的钥匙找到了？刚刚，在理解大模型复杂行为的道路上，OpenAI又迈出了关键一步。他们从自己训练出来的稀疏模型里，发现存在结构小而清晰、既可理解又能完成任务的电路（这里的电路，指神经网络内部一组协同工作的特征与连接模式，是AI可解释性研究的一个术语）。这意味着，如果真存在一种可行的方式来训练机制可解释的大型系统，它们将是破解大模型「黑箱」的钥匙。麻省理工科技评论认为，OpenAI的新研究对于破解大模型「黑箱」意义重大：

2026-01-20 21:38:19 794

原创 AI大模型多智能体系统核心设计模式详解：从零基础到实战应用，一篇搞定！

文章介绍了多智能体系统的四种核心设计模式（Agents as Tools、Workflow、Graph和Swarm模式）的特点、优势和适用场景，并展示了它们在全流程开发自动化、遗留系统维护和代码优化中的应用价值。这些模式使AI辅助开发进入实用阶段，正在重塑软件开发的工作模式和效率标准。在多智能体系统设计中，直接决定了系统的协作效率和问题解决能力。基于Trae的实现特点，我们可以总结出四种核心设计模式，每种模式针对特定类型的开发场景具有独特优势。

2026-01-16 16:14:22 678

原创 AI智能体规划模式教程（超详细）从零基础到实战应用，一篇全掌握，建议收藏！

规划模式(Planning Pattern)是智能体从工具执行迈向理性决策的关键设计模式，通过目标理解、任务分解、步骤排序和执行调整四个阶段，使AI具备"先思考再行动"的能力。该模式结合Tree-of-Thought思维实现多步推理，建立PEOR闭环循环，支持动态调整，使AI能分解复杂任务、保持全局一致性并适应变化环境，是构建真正智能AI系统的核心基础。一、回顾：从工具到计划在第五章中，我们让AI第一次“动了起来”——通过工具模式（Tool Pattern），它能调用API、执行函数、操纵现实世界。但新的问

2026-01-16 15:24:16 971

原创 2025年 AI 大语言模型（LLM）现状、核心技术特点、行业趋势与落地价值

我们正在经历一个。

2026-01-14 11:21:22 1044

原创从0到1开发一个商用 Agent（智能体），把企业级 Agent 从“搭出来”到“跑起来”！！

在大模型技术迅猛发展的今天，AI 应用正从“泛化对话”迈向“深度业务嵌入”的新阶段。如果说上半场的竞争聚焦于模型能力的展示与通用场景的覆盖，那么下半场的核心战场，则毫无疑问是深入企业业务一线的 Agent（智能体）应用。企业对 AI 的期待早已超越“能聊天、会回答”的初级阶段，转而追求能够理解行业语境、执行复杂任务、保障数据主权，并真正融入业务流程的生产力级智能体。这一趋势并非空穴来风。

2026-01-14 10:30:49 1019

原创大模型的技术生态——怎么理解大模型技术以及应用技术

文章阐述了以大模型为核心的技术生态，强调其需具备自然语言理解、创作和使用工具的能力。Agent智能体作为大模型的"手和脚"，使其能够使用工具完成任务。大模型的本质是理解和生成能力的结合，应用过程需要强大的容错处理，因为执行复杂且不稳定。理解大模型原理可从人类能力角度出发，但实现过程却极为复杂。大模型的技术生态本质上就是围绕着大模型这个“人”转的。大家在学习大模型应用开发时会发现有很多种不同的技术方向和框架，而且不同的技术有其使用的业务场景，因此可能就有部分人认为，不同大模型应用技术之间是无关的。

2026-01-09 12:01:24 853

原创 LlamaIndex 深度实战：用《长安的荔枝》学会构建智能问答系统

现在让我们用一张表格总结这三个关键参数：chunk_size：每张卡片写多少字top_k：找几张相关卡片chunk_overlap：相邻卡片重复多少内容1.6 现在，让我们引入术语1.7 小结核心思想：1.把文档切成小块，每块生成"数字指纹"；2.问题也生成"指纹"，找最相似的块；3.把相关块和问题一起给 AI，让它生成答案；关键优势：✅ 基于你的文档（不会编造）✅ 语义理解（不只是关键词）✅ 可以追溯（知道答案来源）接下来：让我们看看如何用代码实现这个系统！

2026-01-09 11:11:49 1068

原创 LlamaIndex 深度实战：用《长安的荔枝》学会构建智能问答系统

现在让我们用一张表格总结这三个关键参数：chunk_size：每张卡片写多少字top_k：找几张相关卡片chunk_overlap：相邻卡片重复多少内容1.6 现在，让我们引入术语1.7 小结核心思想：1.把文档切成小块，每块生成"数字指纹"；2.问题也生成"指纹"，找最相似的块；3.把相关块和问题一起给 AI，让它生成答案；关键优势：✅ 基于你的文档（不会编造）✅ 语义理解（不只是关键词）✅ 可以追溯（知道答案来源）接下来：让我们看看如何用代码实现这个系统！

2026-01-06 14:00:21 678

原创这一篇彻底学会Transformer！（附学习资料）

本文提供了全面的Transformer模型教程，从Seq2Seq和注意力机制基础，到Encoder和Decoder结构详细解析，最后通过机器翻译实战项目加深理解。教程适合深度学习初学者和程序员，系统讲解Transformer核心概念与工作原理，帮助读者从零基础到深入掌握这一重要大模型框架。如果你正在学习深度学习或者大模型相关的内容，肯定听说过Transformer，作为目前最有望实现大一统的模型框架，其影响力不言而喻。

2026-01-06 11:55:25 972

原创 AI大模型微调教程（超详细）35个经典面试问题从入门到精通，一篇全掌握！建议收藏

训练 loss 突然跳高但又下降。

2025-12-31 11:37:15 749

原创 AI构建全景图：六阶段及其方案选型

在开始构建下一个 AI 功能时，我们也许不必要按照每一项都执行。但是，有相对清晰的认识，也是建立品味的过程。只有当见的够多、见过的最佳实践够多，才有可能设计出符合预期、甚至是超出用户预期的产品。

2025-12-31 10:53:04 696

原创教你从零“手搓”一个大模型，别再只会调用API了

在大模型满天飞的今天，我们是甘心做一个只会调用 OpenAI.chat.completions 的 API 搬运工，还是想真正弄懂那个黑盒子里到底发生了什么？本文将用最朴素的代码，完整的实现一个小型LLM。当你亲手写出 Attention 层的矩阵乘法，亲眼看到模型从输出乱码到学会说话，你会发现：大模型，其实也没那么可怕。RoadMap。

2025-12-29 10:25:15 889

原创大模型结构化数据流式输出技术详解（附实例）小白到高手进阶，一篇全掌握+赶紧收藏！

文章探讨了在大模型应用中实现结构化数据流式输出的技术方案。针对传统一次性输出导致响应时间长的问题，借鉴网络流式传输思想，提出在接收端对接收的不完整数据进行解析和组装的方法。特别指出解析难点在于处理不完整结构，建议使用栈等数据结构确保数据完整性，并随着数据结构复杂度增加，解析难度也呈几何级增长。这一技术对提升大模型应用前端渲染体验具有重要意义。网络流与模型流式输出同出一门，没有本质上的区别。在大模型应用中，结构化数据在其中扮演着重要角色，特别是在智能体的实现中；

2025-12-27 11:57:31 738

原创 Dify企业版 vs 开源版：6大核心差异，一文讲透【附：高性价比落地方案】

随着AI进一步的发展，越来越多的企业开始着手于内部的私有化AI建设，通过AI应用的构建、普及加强员工AI素养，提升员工工作效率，而Dify凭借其强大而友好的AI大模型应用编排能力，以及开源免费的特性，受到了众多企业的青睐，逐步成为各企业构建私有化AI平台的首选。Dify除了免费的开源版本，还面向各企业提供Dify企业版，因为两者主要的差异点不是在具体的应用功能上，而是在服务，部署方式以及性能方面，大部分文章描述的不是那么通俗易懂，今天，我就通过更简单形象的表达来讲清楚两者的核心差异点。

2025-12-27 11:50:04 1029

原创 AI大模型强化学习完整指南：从零基础到精通，一篇掌握PPO到SAPO核心算法！

PPO, GRPO, DAPO, GSPO, SAPO 可以视作一条面向大模型强化学习微调的算法演进链：PPO 作为经典强化学习算法，在旧策略采样、clip 约束小步更新的框架下，让大模型可以稳定做策略梯度；GRPO 通过同一 prompt 下的样本组来估计 empirical advantage，省去了 Value Model 的训练开销；

2025-12-25 12:01:11 628

原创大模型应用要学会分而治之的思想

大模型长文处理中，只能使用分段处理的思想，这是大模型应用的原则。最近在研究大模型报告生成和长文本处理的功能，然后发现之前在做大模型应用时很少出现上下文超长的情况，最多也就是多轮对话中出现，而多轮对话主要是由于历史记录导致上下文超长，所以只需要做好历史记录管理即可。但在生成报告和长文本处理过程中，其情况和长对话又有一定的区别；因为报告生成和长文本处理一般不涉及历史记录的问题，但需要对文本内容进行分块处理，否则很容易导致上下文超长的问题，而这一点是大模型本身的特性，无法避免。

2025-12-25 11:31:36 1019

原创 vLLM-Omni全解析：从文本到多模态AI框架，零基础入门到精通，教程收藏必备！

vLLM-Omni的升级，不是小修小补，而是多模态AI基础设施的革命。它让开发者从繁琐的模态切换中解放，专注创新。2026年，随着更多模型接入，这将成为AI部署的标准框架。

2025-12-24 10:42:54 930

原创 AI大模型能力体系详解：从OpenSkills到AgentSkills，一篇看懂三层架构不混淆！

OpenSkills关心的是这是一种什么能力？边界在哪里？需要哪些证据？AgentSkills关心的是这个Agent能不能跑？用什么工具？成功率多少？Anthropic Skills关心的是这种能力是否可能制造误导？是否需要安全约束？同一个“能力主题”，在三个体系里，被放在了完全不同的层级处理。

2025-12-24 10:12:41 1645

原创从零开始学AI Agent：多Agent协作框架全解析，一篇就够，速速收藏！

2025年AI Agent趋势转向多Agent协作，模拟人类团队工作。文章详解四大主流框架：LangGraph(状态图驱动)、CrewAI(角色协作)、AutoGen(对话迭代)和MetaGPT(模拟创业团队)。这些框架让AI能够协调、构建、共同进化，2026年多Agent系统将成为主流。开发者建议从LangGraph或CrewAI入手，掌握这些框架将获得Agentic AI核心竞争力。2025年，AI Agent 的创新不再只是单个Agent的智能提升，而是它们如何“像人类团队一样协作”。从单一任务执行，

2025-12-23 21:58:26 988

原创全面超越Transformer！谷歌提出全新范式嵌套学习！

基于更新频率，定义了一个排序关系（≻）来组织机器学习模型中的各个组件：若组件 A 的更新频率高于 B，或两者频率相同但B 的计算依赖于 A，则称 A ≻ B；若两者互不依赖且频率相同，则视为同频独立。据此，所有组件被划分为多个有序层级——同一层级内组件更新频率一致，层级越高，更新越慢。重要的是，每个组件都对应一个独立的优化问题和专属的上下文（或梯度）流，既适用于参数化模块（如权重、动量），也兼容非参数化结构（如注意力机制），从而。

2025-12-20 11:00:47 836

原创 1300 份问卷告诉你：AI Agent已经卷成这样了

Agent工程是利用大语言模型（LLM）构建可靠系统的迭代过程。由于Agent具有非确定性特征，工程师需要通过快速迭代来不断优化和提升Agent的质量。这是一个全新的工程学科，它不仅需要AI技术能力，还需要系统工程、质量保障和持续优化的综合能力。🚀 规模化部署正在加速- 超过半数企业已将Agent投产，大型企业引领潮流🎯 应用场景多元化- 从客服到数据分析，从内部效率到客户接触点，Agent应用范围不断扩大⚙️ 工程化体系成熟- 可观测性、评估体系成为标配，质量和安全成为核心关注点。

2025-12-20 10:42:42 962

原创终于有人把大模型讲明白了：LLM从入门到精通全解析

今天的大型语言模型,是史上最强大的LLM,也是未来最弱的LLM。从1966年的ELIZA到2023年的GPT-4,我们见证了从简单模式匹配到几乎通用智能的跨越。但这不是终点,甚至不是中点——预训练规模定律告诉我们,更多数据、更大模型、更优架构,仍将带来持续突破。我们正站在一个历史性的转折点。LLM不仅仅是一项技术进步,它代表了从指令编程到学习型智能的范式革命——计算机第一次不再是执行命令的工具,而是能够理解、学习、创造的"智能体"。这场革命充满希望,也充满挑战。它可能极大提升人类生产力,解决复杂问题。

2025-12-20 10:22:20 1240

原创大模型杀不死产品经理，但未来我们可能要做产品界的OnlyFans

本文探讨大模型时代产品经理的价值与变革，指出大模型无法取代产品经理，反而带来职业春天。PRD作为消除幻觉和确认责任的重要工具在当前和未来仍有价值。全民生成式应用是伪命题，大多数人仍需要封装好的工具。未来产品研发将分为三类角色：提问题者(产品经理)、解决问题者(工程师)和审美负责人。细分需求赛道和"用完即抛"的解决方案具有发展潜力，人的局限和AI的局限使得产品经理等角色长期存在。这是一篇合辑文，近期跟很多朋友交流了下大模型应用的感受，也有不少观点碰撞，其中很多内容实际上一脉同源，于是整理一下。

2025-12-19 11:53:02 1206

原创企业级智能问答系统踩坑实录：RAG老是达不到效果的优化方案

本文分享了一个智能问答系统的开发优化过程。针对三个不同子场景的智能问答需求，作者最初采用纯RAG技术建立三个知识库，但效果不佳，出现场景判断不清和召回率低的问题。后通过重新思考，改为按数据类型建立两个知识库（结构化与非结构化），并实现条件查询和相似度查询两个工具，让模型根据需求自主选择。此方案简化了技术实现，大幅提升了系统效果，解决了场景区分和混合数据查询问题。大模型应用开发流程正确，但结果不一定正确。由于大模型技术的复杂性，再加上不同业务场景的特殊需求，导致大模型应用的开发难度很大；

2025-12-19 11:38:09 811

原创构建高效AI智能体（AI Agents）的十条黄金法则，从入门到精通，一篇就够了！

本文提出构建高质量AI智能体的十条核心法则：拒绝为AI而AI，构建小巧专业解耦的系统，强制结构化输出，解释任务背景而非仅指令，编排优于完全自治，优先提示词工程而非微调，重视工具描述，使用缓存与共享机制，以及全面记录日志。强调AI智能体构建是系统工程，需架构设计与细节并重，才能构建出稳定高效且有业务价值的智能系统。建AI智能体（AI Agents）已成为技术领域最热门的话题之一。然而，从最初的概念验证到真正可用于生产环境的系统，这中间存在着巨大的鸿沟。

2025-12-18 14:15:15 571

原创 AI提示词工程完全指南（超详细）从入门到精通，一篇搞定！建议收藏！

提示词工程的优化与迭代提示词工程强调通过不断优化提示词，提高大模型的输出质量。

2025-12-18 13:44:02 1016

原创 AI Agent开发教程（全面详解）从入门到精通，一篇就够了，值得收藏！

本文系统介绍了AI智能体的七大设计模式，包括提示链、路由、并行化三种工作流模式，以及反思、工具使用、规划、多智能体四种智能体模式。文章详细对比了工作流与智能体的适用场景，强调了在构建智能体系统时应保持简洁、处理不确定性，并根据实际需求组合不同模式。通过实证评估不断优化设计是构建高效智能体系统的关键。AI Agent、 Agentic AI、Agentic架构、Agentic工作流、Agentic模式——如今，智能体的概念无处不在。但智能体究竟是什么？我们又该如何构建稳健高效的智能体系统？

2025-12-18 11:57:05 1370

原创如何微调任何Embedding模型？从入门到精通，普通电脑也能做，一篇就够收藏！

Adapter适配器微调是一种参数高效的微调方法。在预训练模型上添加一个轻量级的适配器层，只训练这个适配器，而冻结原始模型参数。原始嵌入 → [冻结的基础模型] → [可训练的Adapter层] → 微调后的嵌入参数少：Adapter层通常只有几MB，而全量微调需要保存整个模型（几百MB到几GB）训练快：只更新少量参数，训练速度提升10倍以上效果好：在特定任务上，Adapter微调的效果往往接近全量微调Adapter微调是一种参数高效、成本低廉、效果显著的嵌入模型微调方法。

2025-12-17 15:13:13 903

原创 GPT-5.2 发布后，我意识到一件事！

GPT-5.2标志着AI从"工具升级"转变为"生产方式升级"，AI角色从辅助工具进化为组织能力，进入"可交付阶段"。它以稳定可靠的表现，使AI能从头到尾完成任务，对AI创业、Agent应用、Prompt工程、开源闭源竞争和小团队发展产生五大冲击。未来AI竞争重点将从"会不会"转向"稳不稳"，掌握AI组织能力将成为关键。很多人第一反应是：“GPT-5.2 又强了一点。”但说实话，如果你只看到“强不强”，那你可能已经错过了这次发布真正可怕的地方。我这几天反复体验 GPT-5.2 之后，心里反而有点发凉。不是

2025-12-17 10:40:53 970

空空如也

空空如也