- 博客(1296)
- 收藏
- 关注
原创 从工具到个人助理——AI Agent的原理、演进与安全风险
摘 要AI Agent作为2025至2026年间最具变革性的技术方向之一,正在重塑人机交互的边界,推动人工智能从被动响应向主动服务的跨越。通过构建感知、规划、决策与反思等核心模块,结合工具调用能力与分层记忆管理机制,AI Agent已具备多步骤推理与环境交互能力,成为大模型时代技术落地的核心应用形态。
2026-03-28 11:58:14
336
原创 小米AI Agent深度解析(非常详细)从零基础看懂手机AI下半场,小白必收藏!
小米AI Agent亮相,具备人车家全生态协同及复杂任务自主执行能力,标志着手机AI进入下半场。文章对比了华为、苹果、三星及小米的优劣势,并建议用户理性换机,从现在开始培养AI使用习惯,提升效率。小米新品发布会。我觉得这次的主角,不是新手机,不是新汽车。而是一个「看不见的管家」——小米 AI Agent,正式亮相。你只需要说一句自然语言指令,它就能帮你完成订餐、导航、日程安排、智能家居控制等一系列复杂任务。不再需要你一步步手动操作,你说一句话,它帮你搞定全链路所有事。这意味着什么?
2026-03-28 11:38:40
143
原创 AI的下半场:智能体(Agent)将如何重塑我们所有的应用?
智能体(Agent)是一个能够代表用户,以高度独立性完成任务(Workflow) 的系统。它能理解用户目标,自主选择行动路径,并利用外部工具执行任务。简单来说,它是“能帮你做事的AI”,而不仅仅是“能和你聊天的AI”。比如你告诉它“帮我分析最新销售数据,并生成周报”,它不会仅仅生成报告模板,而会:1.查询数据库 → 2. 分析关键指标 → 3. 生成图表 → 4. 写出总结报告 → 5. 邮件发送。这就是一个完整的Agent工作流闭环。智能体真正的价值来自它能“动手”。
2026-03-28 11:13:11
151
原创 一文读懂 MCP、RAG、Agent
前言最近,AI 圈被三个词刷屏了 ——MCP、RAG、Agent!几乎每天都有新的相关工具冒出来,各大技术论坛、行业群聊得热火朝天。但不少朋友一看到这些术语就犯迷糊:它们到底是啥?能干啥?和我们普通人又有啥关系?别慌!今天就用最接地气的方式,带你彻底搞懂这些概念,看完秒变 AI 达人!01MCP:AI界的 “万能转换器”MCP 其实是个 “多面手”,不过我们重点关注模型上下文协议(Model Context Protocol),它就像 AI 世界的 “万能转换器”。
2026-03-28 11:11:18
185
原创 鹅厂员工怎么看Agent自动持续进化?
落地一个Agent容易,但通过一定机制自动持续优化Agent却很难,不知道大家当前自动优化agent的方式有哪些?今天不聊 Agent 怎么搭,来聊聊:让Agent 自己优化自己的方式。以下为分享的**「Agent如何自动持续进化?****」,也欢迎大家在评论区也畅所欲言(文末有礼)**
2026-03-27 11:43:54
179
原创 关于智能体(AI Agent)入门,一篇超详细的总结!
要理解智能体的运作,我们必须先理解它所处的任务环境。在人工智能领域,通常使用PEAS模型来精确描述一个任务环境,即分析其性能度量(Performance)、环境(Environment)、执行器(Actuators)和传感器(Sensors)。以上文提到的智能旅行助手为例,下表1.2展示了如何运用PEAS模型对其任务环境进行规约。表 1.2 智能旅行助手的PEAS描述在实践中,LLM智能体所处的数字环境展现出若干复杂特性,这些特性直接影响着智能体的设计。首先,环境通常是部分可观察的。
2026-03-14 14:57:27
569
原创 智能体(Agent):你的24小时数字员工,让一人公司不再是梦
你可能听说过ChatGPT、文心一言这些AI聊天工具,但Agent是个什么东西?打个比方:如果说传统AI是"问答机器",你问一句它答一句;那Agent就是"自动驾驶员工",你只需要说目标,它会自己规划路径、执行任务、甚至主动汇报进度。传统AI你问"怎么写一篇关于咖啡的文章?"它给你一堆建议Agent先搜索最近咖啡行业的热点分析你的历史文章风格生成文章大纲撰写全文配上合适的图片优化标题和SEO关键词甚至帮你定时发布看出区别了吗?Agent不只是聊天,它是真的在"干活"。
2026-03-14 14:48:46
459
原创 OpenClaw(小龙虾)完整安装指南!
加密圈子与AI领域是密不可分的部分,在过去一个月,一位名叫 AlexFinn 的开发者在 OpenClaw 上投入了数万美元,并用它创造了超过 1 万美元的月经常性收入。他的经历揭示了一个事实:99% 的人正在错误地使用这项技术。OpenClaw 是一个开源的 AI Agent 框架,它能够 24/7 不间断地在你的电脑上工作。与 ChatGPT 这类对话工具完全不同,OpenClaw 拥有“眼睛和手”:它可以控制浏览器、编写代码、阅读文件、执行命令,甚至在你睡觉时主动完成任务。
2026-03-11 11:43:19
660
原创 为什么我拖了一个多月才开始使用OpenClaw?(附详细教程)
OpenClaw 已经火了很长时间了,GitHub 上的星标都达到 213K了。记得它刚出来那会,我就关注它了,那时候星标数才20多K,1个多月过去了足足翻了 10 倍,可见其火爆程度超出我们想象~起初 OpenClaw 给我留下印象最深的两点就是:1、它称能 7x24 小时不停歇的干活2、它可以通过移动端聊天程序来远程控制它干活这两点都跟“干活”有关而不是纯理论输出,所谓干活就是能真正帮你产出实际结果,有实际价值产出的玩意儿。
2026-03-11 11:15:44
495
原创 Agent学习范式:给零基础小白的Agent入门指南
这不是一门让你“学完所有内容”的课程。这是一张地图——告诉你现在在哪里,下一步往哪走,最终能到达哪里。方向比速度更重要。当你知道自己在做什么,为什么要做,接下来该做什么——学习就不再是焦虑的囤积,而是有目的的成长。
2026-03-05 14:56:38
362
原创 AI大模型基础教程:从Transformer到GPT,小白程序员必备,收藏看懂大模型原理!
预测下一个 Token。你给它一句话 “今天天气真”,它算出下一个最可能的 Token 是 “好”,概率 0.72;“不错” 0.15;“热” 0.08……然后从中采样一个输出。就这么简单。ChatGPT 能写文章、能编代码、能翻译、能推理,底层都是在一个 Token 一个 Token 地往外蹦。本质:大模型的核心就是 Next Token Prediction——预测下一个 Token架构。
2026-03-05 11:56:28
385
原创 大模型RAG实战教程(超详细):从入门到精通,一篇就够,建议收藏!
RAG(Retrieval Augmented Generation, 检索增强生成)是一种技术框架,其核心在于当 LLM 面对解答问题或创作文本任务时,首先会在大规模文档库中搜索并筛选出与任务紧密相关的素材,继而依据这些素材精准指导后续的回答生成或文本构造过程,旨在通过此种方式提升模型输出的准确性和可靠性。RAG 技术架构图介绍:富文本 主要存储于 txt 文件中,因为排版比较整洁,所以获取方式比较简单实战技巧:【版面分析——富文本txt读取】
2026-02-16 11:45:00
1226
原创 从Transformer到GPT:大模型是如何诞生的
文章分析了GPT大模型成功的关键因素:一是选择仅使用Decoder结构,将理解内化到生成过程中;二是坚持纯语言建模目标,始终使用Next Token Prediction;三是通过规模扩大,使模型表现出多任务能力和涌现能力。GPT-3的出现标志着语言模型从NLP工具转变为通用智能底座,工程范式也从"模型训练"转变为"Prompt编程"。前面已经写完了Transformer系列文章,现在有这么一个疑问:Transformer 明明已经很强了,那 GPT 这种“大模型”,到底强在了哪里?
2026-02-15 11:15:00
646
原创 AI Agent开发实站教程,看这一篇就够了!
本文分享大厂风控产品经理的智能体开发19条实战经验,涵盖业务需求理解、知识库构建、意图识别、模型边界设定、评测体系、架构设计、工作流优化、确定性逻辑处理、参数验证、日志埋点、可解释性设计及运营机制等方面。强调稳定交付、明确边界和持续运营的重要性,为智能体开发提供实用指导。主职工作是大厂做风控产品经理,工作中做了客诉、风险分析、策略生成、规则模板等智能体,自己独立也做了很多内容自动化、内容分析的智能体,如下几篇文章在这个过程中踩了很多坑,总结了 19 条做智能体的经验。
2026-02-12 07:45:00
1249
原创 AI智能体(Agent)全攻略(图文并茂)从零基础入门到项目实战,一篇搞定,必看收藏!
智能体(Agent)是一个能够代表用户,以高度独立性完成任务(Workflow) 的系统。它能理解用户目标,自主选择行动路径,并利用外部工具执行任务。简单来说,它是“能帮你做事的AI”,而不仅仅是“能和你聊天的AI”。比如你告诉它“帮我分析最新销售数据,并生成周报”,它不会仅仅生成报告模板,而会:1.查询数据库 → 2. 分析关键指标 → 3. 生成图表 → 4. 写出总结报告 → 5. 邮件发送。这就是一个完整的Agent工作流闭环。智能体真正的价值来自它能“动手”。
2026-02-10 10:29:20
1163
原创 Agent Skills完全指南(超详细)从零基础到精通,一篇全掌握,建议收藏!
它是指一个包含指令、脚本和资源的有序文件夹,代理可以动态发现并加载这些 文件夹,从而更好地完成特定任务。Skills 是一种“给 Agent 用的、可复用的流程型能力封装”,它不是 Prompt,也不是 MCP,而是把个人或者团队的 SOP 变成 Agent 可以随时调用的“技能包”。
2026-02-09 11:50:15
1038
原创 Agent、Workflow、RAG_还是_Skill?
我们紧跟当时的技术潮流,试图冲击创造力的上限,但遗憾地遭遇了基座模型代差的降维打击。我们坚守了产品的可用性底线,通过流程和知识库,稳住了用户的基本盘。我并没有陪这个产品走到最后。但在我离开后,它维持着这种分裂但平衡的状态,并依然运营至今。这也揭示了AI 产品真正的护城河不纯粹依赖模型有多聪明,而是产品承载了多少真实世界的复杂性。正是因为我们把业务逻辑从模型中解耦出来,固化在 Workflow、RAG 中,这个产品才没有随着早期模型策略的失误而崩塌,而是获得了一个边跑边修的机会。
2026-02-09 11:28:09
715
原创 超详细Agent Skills教程:零基础入门到精通,一篇就够了,赶紧收藏!
本文详细介绍了Agent Skills的创建和使用过程,包括Cursor升级、Skill文档创建、项目目录设置及技能调用。Skills本质是标准化需求文档集合,可提高AI编程效率,避免遗漏业务逻辑。文章还探讨了Skills的高级应用,如脚本调用和多Agent协作,为AI编程提供了实用指导。
2026-02-09 11:07:17
707
原创 AI大模型MCP协议深度解析:从零基础到代码执行环境,一篇搞定Agent工具连接!
Anthropic 在 2024 年 11 月推出了 Model Context Protocol (MCP),这是一个连接 AI Agent 到外部系统的开放标准协议。本文是 Anthropic 工程团队在 MCP 推出一年后,针对大规模工具连接场景下的性能瓶颈,提出的创新性解决方案——通过代码执行环境与 MCP 结合,实现 98.7% 的 token 使用率降低。这不仅是一次技术优化,更是 AI Agent 架构设计理念的重大转变。具体案例Description:从GoogleDrive检索文档。
2026-02-06 11:35:23
754
原创 使用MCP执行代码:让Agent效率提升98.7%
Anthropic 在 2024 年 11 月推出了 Model Context Protocol (MCP),这是一个连接 AI Agent 到外部系统的开放标准协议。本文是 Anthropic 工程团队在 MCP 推出一年后,针对大规模工具连接场景下的性能瓶颈,提出的创新性解决方案——通过代码执行环境与 MCP 结合,实现 98.7% 的 token 使用率降低。这不仅是一次技术优化,更是 AI Agent 架构设计理念的重大转变。具体案例Description:从GoogleDrive检索文档。
2026-01-20 21:22:00
1080
原创 AI智能体终极记忆方案!Graphiti教程从零到精通(建议收藏),一篇就够了!
实时将文本或结构化数据转化为“知识片段”(Episode)自动提取实体与关系,构建语义网络支持超低延迟的混合检索(语义关键词图路径精确追踪事件发生时间和被记录的时间(双时间维度)它不是传统的知识图谱工具,也不是简单的向量数据库,而是为 AI Agent 的大脑量身打造的记忆系统。然后告诉 Graphiti:“以后看到类似结构,就按这个模型提取!这样就能构建出高度定制化的专业知识图谱。简化复杂度:将复杂的图谱构建过程抽象成简单的 API 调用,开发者可以专注于业务逻辑。
2026-01-19 11:57:24
732
原创 LangGraph大模型部署完全指南(珍藏版)从零基础入门到企业级部署,一篇全掌握,必收藏!
文章详细介绍了LangGraph 1.0三种部署方式:独立服务器适合轻量级设置;LangSmith方式提供本地监控无需部署管理;LangSmith with deployment提供完整部署管理功能。作者提供了每种方式的详细部署步骤,并指出独立服务器对日常开发足够,而本地部署LangSmith需要较高硬件配置、可能遇到环境配置问题,且需要企业级许可,更适合企业使用。
2026-01-19 11:49:42
902
原创 Dify知识库图文混排两种方案详解,从入门到精通,建议收藏!
核心收益•灵活性高:知识库源文件(Markdown)和图片资源(图床)是分离的,未来无论迁移到哪个系统,都非常方便。•方便管理:图片资源集中在图床(如 OSS)管理,查找、替换都很方便。但是缺点•成本:需要额外的图床服务器或对象存储服务费用。•运维:需要处理图床的访问权限、白名单(就像我遇到的 Referer 问题),甚至要多维护一个系统。所以word方案总结下来,就是成本短期相对低一些,不需要单独的图床服务器,图片存储在dify的 Docker 卷中,开箱即用。
2026-01-16 16:15:10
855
原创 继MCP之后,Anthropic又来制定新标准了!
什么是 Skills,就是为大模型提供具体的某种能力,这听上去有点类似与 MCP 的概念,巧了,MCP 也是 Anthropic 提出来的。接着说什么是 Skill,假设我想查询明天的天气,如果只用大模型自己的能力肯定不行,它必须要联网搜索,而联网搜索天气预报这是一个具体且专业的事情,之前用 MCP 可以做到,现在呢,用 Skill 也能做了,这个Skill 的能力就是查天气,可能是一个 Python 方法,就是到某个天气网站搜索天气情况。在 Claude 设置页面,有一些 Claude 内置的技能。
2026-01-16 15:49:13
866
原创 AI大模型实战教程(超详细)从零入门到精通:微舆舆情分析系统全解析!
一句话足矣~本文主要讲解了微舆的整体架构,并通过研读并调试源码,整理了多个Agent各自的执行流程、以及前后端交互。如项目原理、项目部署、源码等存在疑问,欢迎随时私信或留言交流!
2026-01-16 14:56:52
897
原创 RAG(检索增强生成)架构与原理:告别LLM“幻觉”的秘密武器
检索增强生成(Retrieval Augmented Generation,简称RAG)是一种优化大型语言模型(LLM)输出的技术。它通过在生成响应之前,从外部权威知识库中检索相关信息,并将其作为上下文提供给LLM,从而提高LLM回答的准确性、可靠性和时效性,同时有效缓解LLM可能出现的“幻觉”问题。RAG技术通过将外部知识检索与大型语言模型相结合,为解决LLM的“幻觉”问题和知识滞后性提供了有效的途径。它不仅提高了LLM回答的准确性和可靠性,还降低了模型训练和维护的成本。
2026-01-14 11:23:08
693
原创 王炸!一款开源的AI知识库!5分钟零代码搭建
还在为知识管理混乱发愁?学习笔记散落在文件夹、企业文档查找像大海捞针、客户咨询重复回复占用大量时间?今天给大家安利一款 AI 驱动的开源王炸工具 ——PandaWiki,无需编程基础,5分钟就能搭建起智能化知识库,不管是个人学习沉淀还是企业高效协作,都能完美 hold 住!PART 01项目概述:AI + 开源PandaWiki 是一款由 AI 大模型驱动的开源知识库搭建系统,凭借强大的功能和极低的上手门槛,帮助你快速构建智能化的,借助大模型的力量为你提供等能力。
2026-01-14 11:16:32
1243
原创 一文读懂RAG知识库系统:原理、演进与落地全步骤(附实操代码)
RAG全称为"检索增强生成"。2020年,Meta AI研究院的Patrick Lewis团队在其里程碑式的论文《Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks》中首次系统性地提出了这一框架。它的诞生,直接针对早期大语言模型(如GPT-3)的三个致命短板:易产生"幻觉":可能生成不准确或完全虚构的内容;知识更新滞后:模型训练后知识即固化,难以跟进最新信息;缺乏可追溯性:回答往往不标注来源,难以验证可信度。
2026-01-14 10:58:09
824
原创 全球首个Zero-Error RAG系统:Henon如何让金融AI告别幻觉
Retrieval-Augmented Generation(检索增强生成)技术诞生至今,准确率从60%爬升到85%,看似进步显著,但距离金融行业要求的"零容忍"标准,仍有一道鸿沟。传统RAG系统在处理合同条款、财务报表、法律备忘录等非结构化数据时,幻觉率(Hallucination Rate)依然维持在8-15%区间,这意味着每100条AI生成的金融洞察中,至少有8条存在事实性错误。
2026-01-14 10:51:16
1055
原创 全面解析 Agent Engineering 的 10 大工程维度:生产级 Agent 系统的炼成之路。
技术层面的突破让AI智能体(Agent)成为当前绝对的AI热点。但随着Agent应用走向真实业务,也逐渐暴露出其工程瓶颈:不确定性、幻觉、不可观测、性能、安全、成本等多方面存在挑战…这些问题不会因为模型更强而自动消失。“打造一个Agent应用的Demo只需花20%的时间,但把它打磨成产品要花剩下80%的功夫”。这条技术与工程间的鸿沟,正在催生出新的“学科”—。有理由相信:在强劲的需求驱动下,智能体工程的方法论、技术与产品,将成为 2026 年 Agent 的最重要热点。
2026-01-14 10:47:31
649
原创 Transformer架构的分步计算流程
本文详细解析了Transformer架构的核心组件,包括输入数据处理中的分词、词嵌入和位置编码,Encoder中的多头注意力机制与残差连接,以及Decoder的掩码自注意力和跨注意力机制。文章通过分步说明,解释了如何将输入序列转换为矩阵表示,并通过自注意力机制捕捉序列依赖关系,最终通过Softmax输出预测概率,为理解大型语言模型的工作原理提供了全面而深入的视角。上图是Transformer新型神经网络架构。在Transformer出现之前,如如机器翻译等序列建模任务主要依赖循环神经网络(RNN)。
2026-01-09 11:15:15
801
原创 智能体架构相爱相杀?一文了解LangChain和MCP
LangChain与Python MCP集成面临接口抽象冲突、状态管理不一致、性能损耗、版本兼容性、调试困难及安全管控六大问题。应对策略包括开发统一数据转换中间层、采用单向数据流设计、精简参数传输、版本锁定与抽象解耦、全链路trace_id追踪及鉴权信息托管。实践中需平衡LangChain的灵活性与MCP的标准化,根据场景取舍适配层设计。今年以来 mcp实在太火了,有个比喻挺贴切的,当大模型有了 mcp就相当于有了手和脚,真正可以替用户干活了。甚至,有预言 mcp会是未来专属大模型的 app。
2026-01-06 14:23:18
1086
原创 基于LangChain构建下一代AI应用
—这些任务,AI聊天工具已经能出色地完成。然而,当我们将目光转向日常工作中更核心、更复杂的业务场景时,可能会遇到这样的困境:你:“ChatGPT,帮我看看游戏服本地测试9000的CPU负载是不是太高了?如果高,就安排它凌晨3点重启一下。
2026-01-06 11:57:20
742
原创 2026年7种大模型最流行的强化学习算法总结
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。我意识到有很多经验和知识值得分享给大家,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓CSDN粉丝独家福利这份完整版的 AI 大模型学习资料已经上传CSDN,朋友们如果需要可以扫描下方二维码点击下方CSDN官方认证链接免费领取【保证100%免费】
2025-12-31 11:47:56
1079
原创 Ollama+Qwen 3 +Obsidian打造隐私知识库,一篇就够了,必收藏!
构建个人知识库智能问答体,其实标准的做法那就是 RAG。什么是 RAG?RAG (Retrieval-Augmented Generation,检索增强生成)它给大模型(LLM)配了一个实时查阅的“外挂数据库”或“离线手册”。幻觉(Hallucination):没见过的数据它会一本正经地胡说八道。知识滞后:它的知识停留在训练结束的那一天(比如 2023 或 2024 年)。
2025-12-31 10:56:04
1090
原创 RAG检索总是搜不到?别卷Prompt了,手把手教你微调垂直模型!
通过今天这篇文章,我们没有使用任何黑盒工具,而是从数据挖掘原理到代码落地,彻底跑通了 Embedding 微调。你会发现,当你把“硬负例”喂给模型后,它仿佛瞬间开窍了,能精准识别那些曾经让它困惑的“行业黑话”。下一步做什么?虽然代码微调很爽,但在大规模工程化场景下,我们可能需要更快捷的工具。下期文章,我将教大家使用AutoTrainms-swift体验“一行命令”的多卡训练!
2025-12-29 15:30:03
1031
原创 RAG高级技术完整教程-迪士尼智能客服全案例【下】
续上一篇的内容第十一章:GraphRAG - 知识图谱增强检索11.1 传统RAG的局限性在前面章节中,我们使用的都是文本块(Chunk)检索的方式。虽然已经很强大,但在某些场景下仍有局限:场景1:多跳推理问题场景2:全局性总结问题11.2 GraphRAG核心思想GraphRAG通过知识图谱来组织信息,建立实体之间的显式关系:GraphRAG的优势:关系显式化:不再依赖文本相似度,而是通过图结构表达关系多跳推理:沿着图的边可以自然地进行多跳查询全局理解。
2025-12-29 15:07:23
866
原创 AI大模型强化学习完整指南:从零基础到精通,一篇掌握PPO到SAPO核心算法!
PPO, GRPO, DAPO, GSPO, SAPO 可以视作一条面向大模型强化学习微调的算法演进链:PPO 作为经典强化学习算法,在旧策略采样、clip 约束小步更新的框架下,让大模型可以稳定做策略梯度;GRPO 通过同一 prompt 下的样本组来估计 empirical advantage,省去了 Value Model 的训练开销;
2025-12-27 11:58:23
781
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅