自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(865)
  • 收藏
  • 关注

原创 Token经济学:六大AI Agent框架的Token消耗深度拆

有人用 OpenClaw 聊 2 小时花了 100 多元[3],有人 35 条消息就撑爆 200k 上下文窗口[2]。(同一模型在不同框架下消耗截然不同)和(不同模型完成同一任务所需 Token 数不同)。本文从这两个维度,对六大框架做一次聚焦于 Token 消耗的深度拆解。声明:尚无统一基准测试覆盖全部六框架,数据来自公开文章交叉比对,估算值已明确标识。01框架架构如何"吃掉"你的 Token每次调用大模型时,框架会将"基础设施内容"塞进上下文,这部分与用户任务无关却消耗 Token。

2026-03-14 15:53:42 594

原创 现代 Agent 的关键不是 Prompt,而是 Context Engineering

如果今天讨论 Agent 还停留在"怎么写 prompt",就已经太窄了。像 Codex、Claude Code 这类现代 coding agent,在你按下回车之前,系统已经完成了一系列复杂的上下文工程:加载 AGENTS.md、注入 skills 摘要、过滤 MCP tools、组装 developer message……你看到的"一条 prompt",背后是多层结构化注入。更关键的是 Context Engineering。

2026-03-14 14:52:41 327

原创 OpenClaw 到底是什么?

OpenClaw的出现代表了AI发展的一个重要趋势——从"对话式 AI"走向"自主行动式 AI未来的AI不再只是一个App,而是一个凌驾于所有App之上的"智能管家",帮你在背后默默处理各种琐事。当然了,现在的OpenClaw还不够完美,安全性、稳定性都还有提升空间。但作为一个开源项目能做到这个程度,已经相当惊艳了。如果你是一个喜欢折腾的开发者,非常建议去试一试。📌相关链接OpenClaw 官网:https://openclaw.ai/

2026-03-11 13:55:41 825

原创 普通人慎入养“虾”,跟风养三天后发现的风险预警

我不否认OpenClaw的强大——它确实是一款优秀的开源AI框架,能帮开发者、极客实现自动化办公、提升生产力,能让AI真正"动起来",而不是只停留在"聊天"层面。但它的强大,是建立在"技术基础"“时间投入”“成本消耗"之上的,它是给开发者、极客准备的"工具”,而不是给普通人准备的"玩具"。最近的跟风热潮,本质上是自媒体贩卖焦虑、商家收割流量的结果,很多普通人被热度裹挟,盲目投入时间、金钱,最终只能"竹篮打水一场空"。**所以,劝所有普通人:**别再跟风养"虾"了。

2026-03-11 11:45:42 481

原创 #大模型技术「新手必学路线」,从入门到实战,收藏这篇就够了!

本文提供了一套针对新手的AI大模型技术学习路线,包括Python基础、大模型基础概念、LangChain核心技术、低代码平台Coze以及可选的Dify平台。建议优先学习LangChain,掌握大模型应用开发的核心技能,再逐步拓展其他平台,为从事AI开发或中台工作打下坚实基础。最适合新手、最不绕路、学完就能干活的路线,按你是想走技术开发来安排:大模型技术学习「最简必学路线」Python 基础:变量、函数、列表、字典、循环会用 pip 装包、运行脚本不用学爬虫、数据分析,够用就行。

2026-03-05 15:14:31 406

原创 Ai大模型知识蒸馏,如何让大模型“瘦身”并保留智慧

本文详细解析了AI大模型知识蒸馏技术,从大模型工作原理、硬目标与软目标训练对比,到知识蒸馏如何高效提炼大模型能力,并探讨了Anthropic与中国AI实验室的“蒸馏攻击”争议,揭示了大模型领域的技术边界与地缘竞争。适合AI小白和程序员学习大模型核心技术。2026年2月下旬,全球AI圈爆发了一场前所未有的舆论地震。

2026-03-05 14:43:16 362

原创 昨夜,Claude智能体压垮华尔街,近万亿刀市值蒸发

Anthropic的Claude Cowork智能体及其插件被视为AI从辅助工具向独立员工跨越的分水岭,能自主完成复杂工作。这一技术引发华尔街恐慌,导致多家软件公司股票被抛售,市场担忧AI将颠覆SaaS商业模式。Claude Cowork可在隔离环境中接管用户电脑执行多领域任务,可能减少企业对外部软件服务的依赖,威胁传统软件行业。AI 在代替人类之前,先要替代一大波软件?

2026-02-16 11:15:00 591

原创 当Ollama遇上RAG:给你的本地AI装上“记忆外挂”

文章介绍Ollama+RAG+ChromaDB组合解决方案,解决AI模型记忆力有限问题。Ollama作为本地AI大脑,RAG实现检索增强生成,ChromaDB作为语义向量数据库存储知识。该组合使AI能基于最新、准确的信息回答,同时保持完全本地化、低成本,适用于客服、培训、知识管理等场景。但需注意知识库维护和文档质量对回答准确性的影响。

2026-02-14 09:15:00 1191

原创 Spring AI系列之RAG(检索增强生成)从原理到实战指南

选择RAG的场景• 需要实时更新的知识(如新闻、股价)• 数据量庞大且频繁变动• 需要解释性强的应用场景(可溯源到具体文档)• 预算有限,无法承担微调成本选择Fine-tuning的场景• 需要改变模型行为风格(如特定语气、格式)• 领域知识非常固定且通用模型表现极差• 对延迟敏感(RAG需要额外检索时间)

2026-02-12 07:30:00 630

原创 Claude Agent Skills深度解析(超详细)从零基础到精通,一篇就够了!

Claude 利用Skills来提升特定任务的执行效果。Skills被定义为包含指令、脚本和资源的文件夹,Claude可以在需要时加载它们。Claude 采用声明式、基于提示词的系统来实现Skills的发现和调用。AI 模型(Claude)根据系统提示中提供的文本描述来决定是否调用Skills。在代码层面,不存在算法驱动的Skills选择或 AI 驱动的意图检测。所有的决策都完全基于Skills描述,在 Claude 的推理过程中完成。Skills并非可执行代码。它们不。

2026-02-09 11:43:36 965

原创 AI Agent记忆系统完全指南(超详细)从入门到精通,一篇收藏就够了!

Memory in the Age of AI Agents》是由多所顶尖大学联合推出的系统性综述,创新提出"形态-功能-动力学"三维框架分析200+最新论文。文章突破传统记忆二分法,提出Token-level/Parametric/Latent三大记忆形态,系统阐述记忆形成、演化与检索的完整生命周期。同时展望生成式记忆、自动管理等7大前沿方向,为AI Agent记忆研究提供全面指导,是了解该领域的必读文献。分享今年看到最系统&最新的综述,NUS&人大&复旦&北大&同济等联合出品:《

2026-02-09 11:35:50 874

原创 RAG检索增强是在给大模型“喂”数据?不,你是在为它构建一整套物流体系

RAG就像一套完善的物流管理体系,其核心困难点永远在我们看不到的地方。在很多人看来,做检索增强生成的难点在于提升检索召回的效率和准确率,因,因此很多人把大量的时间花在优化检索方案上。但作者作为一个对RAG有深入了解的开发人员,恰恰认为RAG真正的难点并不在检索端,而在于知识库的管理。为什么会说RAG的难点在知识库的管理,而不是数据召回?知识库管理很多人都知道RAG是检索增强生成,从知识库中检索到数据,然后丢给模型进行处理,以达到更好的输出效果。但这根本没有真正理解RAG到底是什么?

2026-01-14 11:19:54 836

原创 怎么打造专属的AI知识库?

AI 时代,坚持一个原则会很受用。那就是越简单越好。根据这个原则,AI 知识库用现成的工具就好(比如腾讯 IMA)。也根据这个原则,知识库越精越好,可以量身定制,打造多个小型的知识库。另外,AI 知识库依然大有可为,但能不能复现原文,是未来的重点。根据以上思路,不止是二手文献,一手文献也可以做知识库。那就不仅仅是查缺补漏了,而是实实在在改变我们的研究方式。未来可以做的,比如李白的平行文本知识库、六朝文献的平行文本知识库,大家可以任意发挥想象力。

2026-01-14 10:52:57 787

原创 2025年大模型盘点:从零基础到精通,收藏这一篇就够了!

2025年大模型领域以推理模型、RLVR与GRPO技术为主导,GRPO成为研究热点。架构上Transformer仍是主流,但效率优化增多。推理扩展和工具调用成为提升性能的重要手段,"刷榜"现象凸显benchmark评估的局限性。AI在编程、写作和研究领域展现强大能力,私有数据成为竞争优势。未来发展方向包括RLVR扩展、工业级扩散模型和更好的长上下文处理技术。本文基于老司机推荐的年终盘点这篇文章的原始作者叫 Raschka,长期在 Substack 输出技术内容。他的书被翻译成9种语言,被多所大学用作教材。

2026-01-09 16:06:11 1015

原创 2025年中国大模型行业报告(极简版)从零基础入门到精通,一篇就够了!

中国大模型行业蓬勃发展,产业链涵盖基础层、模型层和应用层。当前商业化进程活跃,金融、政府、教育等领域渗透率高。2023年市场规模增长超100%,预计2030年将超2200亿元,年复合增速40%以上。未来预测大模型、决策大模型和具身智能大模型有望成为行业新风口。百度、阿里、腾讯等企业积极布局,专利申请数量领先。行业概况1、定义大模型是指包含超大规模参数(通常在十亿个以上)的神经网络模型。

2026-01-09 14:19:35 788

原创 AI智能体技能完全指南(超详细)从零基础到精通,一篇全掌握,值得收藏!

什么是LLM AgentSkills?——基于提示词的元工具架构在构建生产级大型语言模型(LLM)驱动的智能体(Agent)系统时,“技能”(Skills)代表了一种至关重要的架构范式。Skills并非传统的外部工具或API调用,而是被精确定义为封装的专业知识(Packaged Expertise),其核心作用在于塑造Agent的思维模式和解决问题的方法 [1]。Skills不直接执行代码,而是提供关键的上下文、指令、领域知识和行为模式,从而显著提升Agent在处理特定、复杂任务时的表现 [1]。

2026-01-09 11:49:30 1180

原创 太强了!AI领域权威专家Antonio Gulli精心打造的《智能体设计模式》终于发布了!附PDF

这本书简直就是系统阐述人工智能智能体设计方法的宝藏书,结构清晰到像开了导航,案例实用得就像直接给你抄作业,把构建现代智能体系统的核心模式与实践路径,完完整整地呈现在你面前👏📖这本书阅读价值拉满书里一口气系统梳理了21种关键设计模式,像提示链、动态路由、并行执行、反思优化、工具调用、任务规划、多智能体协同、记忆管理这些核心议题,全都被安排得明明白白🤩 每种模式都配有能直接执行的代码示例,还有超详细的图解说明,就算你是小白,也能快速把设计理论变成实际应用!

2026-01-06 14:18:41 603

原创 AI Agent实战教程:从ChatGPT到能动手的AI助手,收藏这篇就够了!

本文讲述了AI从传统语言模型(LLM)向AI Agent的革命性转变。LLM只能输出信息不能执行操作,而AI Agent通过记忆、使用工具和目标驱动能力,能够实际完成任务。MCP作为AI Agent与外部世界交互的"翻译官",解决了不同API接口的标准化问题。Agent to Agent协作模型实现了专业分工,大幅提升效率。2025年将是AI Agent和MCP的落地年,这不仅是技术升级,更是工作方式的革命,将为掌握这些工具的人带来碾压性的效率优势。

2026-01-06 14:13:25 1085

原创 AI大模型训练全攻略:优化器+学习率策略,从入门到精通,一篇搞定!

*因为要记录显存所以需要框架:**

2025-12-31 11:09:59 821

原创 从Function Call到Agent Skills,一文掌握大模型工具调用发展历程与核心技术

文章介绍了LLM工具调用的发展历程,从OpenAI的Function Call,到解决生态碎片化的MCP协议,再到最新的Agent Skills。Agent Skills是一种模块化的能力包,包含元数据、主体文档和关联文件,采用渐进式披露方式,与MCP协同工作,为LLM提供轻量化、可组合、可移植的专业技能。Skills解决了LLM专业领域技能匮乏问题,是上下文工程的重要技术。

2025-12-31 11:02:30 1066

原创 AI大模型强化学习完整指南:从零基础到精通,一篇掌握PPO到SAPO核心算法!

PPO, GRPO, DAPO, GSPO, SAPO 可以视作一条面向大模型强化学习微调的算法演进链:PPO 作为经典强化学习算法,在旧策略采样、clip 约束小步更新的框架下,让大模型可以稳定做策略梯度;GRPO 通过同一 prompt 下的样本组来估计 empirical advantage,省去了 Value Model 的训练开销;

2025-12-25 15:59:56 706

原创 这是一份超级全面的AI开源项目汇总!(附学习资料)

文章介绍了一个全面的AI开源学习项目,包含六大核心部分:提示词工程、AI教程、AI机器人、多模态大模型、智能体和推理优化。该项目汇集了全球优秀的人工智能开源资源,适合不同需求的开发者学习。内容涵盖从基础理论到前沿应用,帮助读者系统掌握AI大模型相关知识,提升技术能力。建议读者根据自身需求选择学习内容,避免学习压力过大。人工智能这几年发展的速度越来越快,从卷积神经网络的不断突破迭代,到Transformer致力于实现大一统,再到MOE超大规模神经网络的架构范式,还有LangGraph等框架等。

2025-12-25 11:51:28 800

原创 上下文不等于记忆:从单Agent到多Agent协作!

首先,你需要区分,可见性与持久性。其次,记忆必须通过模式来设计流程和评估循环。再者,只有当记忆系统可靠且有用时,智能体本身才能变得可靠且有用。AI 的未来,不仅仅在于更强的模型,更在于更强的记忆。它让Agent拥有了时间感,拥有了经验,更拥有了与小伙伴们并肩作战的信任基础。👥。

2025-12-24 10:31:46 648

原创 AI大模型教程(超详细)从零基础入门到精通,解决实战小技巧,一篇搞定!

文章讲述了作者在Go项目中处理protobuf文件时的技术难题。作为AI coder,作者尝试多种方法让IDE获取proto文件均告失败。最终通过技术分享了解到实用技巧:使用下载proto文件的Go文件夹,再用找到本地缓存地址获取proto文件。这一经历让作者认识到,即使拥有强大的AI模型和工具,掌握实用的小技巧仍然非常重要。这句话最近老火了,来自油管 Anthropic 两个工程师的视频。正好我最近遇到的一个需求还挺符合这个描述的。

2025-12-24 10:27:40 999

原创 RAG检索增强生成教程(超详细)从零基础入门到精通,一篇全掌握,建议收藏!

RAG是一种方法论,由检索和增强生成两部分组成,旨在解决大模型知识更新不及时、幻觉和时效性问题。检索是核心组件,采用不同搜索技术如字符串匹配、分词和语义相似度检索,而针对格式化数据可利用大模型理解能力生成查询语句。上下文构建质量和检索数据质量共同决定了大模型生成内容的优劣。搜索技术是RAG的核心组成部分,没有搜索就不存在RAG。说到RAG检索增强,很多人都知道它是和大模型应用有关的技术,而且网上也有很多介绍RAG的文章和代码;作者在之前的文章中也介绍过RAG的本质并不是指一项具体的技术,而是一种方法论;

2025-12-20 10:55:16 858

原创 10分钟拆解AI大模型,从玄学到看得懂的底层逻辑

看到这里,你是不是觉得AI没那么神秘了?它不是什么"黑科技",更不是"有灵魂的生命"——它就是一个通过海量数据训练出来的"超级概率计算器",擅长根据上下文预测下一个词。它能写诗、写代码、做翻译它能分析数据、回答问题、提供建议它甚至能在某些领域超越人类专家接龙游戏 + 概率预测 + 向量分类 + 注意力机制。理解这些原理,不是为了让你变成AI工程师,而是让你在使用这些工具时,心里有底——知道它的能力边界在哪里,知道它为什么会犯错,知道如何更好地"驾驭"它。毕竟,在这个AI狂飙的时代,

2025-12-20 10:38:32 733

原创 如何微调任何Embedding模型?零基础入门到精通,一篇搞定!

Adapter适配器微调是一种参数高效的微调方法。在预训练模型上添加一个轻量级的适配器层,只训练这个适配器,而冻结原始模型参数。原始嵌入 → [冻结的基础模型] → [可训练的Adapter层] → 微调后的嵌入参数少:Adapter层通常只有几MB,而全量微调需要保存整个模型(几百MB到几GB)训练快:只更新少量参数,训练速度提升10倍以上效果好:在特定任务上,Adapter微调的效果往往接近全量微调Adapter微调是一种参数高效、成本低廉、效果显著的嵌入模型微调方法。

2025-12-19 11:56:14 832

原创 面向生产环境的LLM Prompt 优化:缓存、结构、自动

本文介绍了四种提升大语言模型(LLM)应用性能的实用技术:利用缓存token降低成本和提高速度;将用户问题置于提示末尾提升性能;使用提示优化器改进提示结构;建立定制化基准测试选择最适合的模型。这些简单易行的方法能显著降低延迟和成本,同时提高生成结果的质量。大模型(LLM)能够自动化大量任务。自2022年ChatGPT发布以来,市场上涌现出越来越多利用 LLM 的AI产品。然而,我们在使用 LLM 的方式上仍有许多可改进之处。

2025-12-19 11:47:18 978

原创 万字长文AI智能体:17种智能体架构详解,从零基础入门到精通,一篇搞定所有知识点!

然后执行一个。

2025-12-18 17:51:09 1269

原创 非专业也能看懂的AI大模型工作原理!(非常详细)从零基础到精通,一篇就够了!

本文全面介绍AI大语言模型工作流程,从文本输入预处理到输出生成全过程。涵盖分词嵌入、Transformer架构、自注意力机制、位置编码及长文本外推等技术,并结合DeepSeek V3实例解析模型如何将语言转换为数学矩阵并生成回答。同时提供丰富的工程实践指导,包括上下文优化、耗时控制、多Agent协同等实用策略,帮助读者深入理解大模型原理与应用。👉目录1 输入:从用户提问到模型"看得懂"的矩阵2 Transformer架构与自注意力机制:模型如何“理解”上下文。

2025-12-18 14:03:35 1590

原创 Gemini 3使用宝典(必收藏)非技术人员免费使用指南,一篇搞定!

(比如合同原件、核心代码)往里扔。

2025-12-17 15:18:41 1284

原创 从大模型到多模态,图文混排Agent彻底起飞~

多模态时代的 Agent 和纯文本时代完全不一样。模型不再只是读信息,而是看信息。它知道 Figure 2 在第 4 页的左上角,知道 Table 3 的边界在哪里,知道如何把这些视觉元素编排到文章中。非常符合GLM4.6V的宣传语: 不止能看,更能执行。

2025-12-17 14:56:11 696

原创 从NLP到大语言模型入门教程!(附学习资料)

本文推荐datawhale开源的"从NLP到大语言模型教程",分理论、实战、微调量化、应用部署四部分,系统讲解大模型知识,适合零基础学习者快速构建知识框架。教程涵盖NLP基础、预训练模型、微调技术及部署方法,学完可深入大模型细分方向,助力成为优秀算法工程师。今年的秋招大模型算法岗位也是非常火热,基本上大厂都开出了总包50w+的算法,大模型在未来几年将会有很多落地的场景和应用,大有可为。

2025-12-11 11:27:43 1014

原创 企业级AI Agent构建全攻略(超详细)从零基础到实战应用,收藏这一篇就够了!

了解一个产品,最直观的就是产品相关的文档了。在概述里看了下提炼了下• 企业级 AI Agent 无代码构建平台• 零代码• 快速创建• 企业级安全看看GPTBots.ai 解决了哪些痛点问题。痛点解决方案LLM 幻觉知识库增强 + 引用溯源 + 内容审核缺乏垂直知识RAG 系统 + 多格式知识库 + 持续训练无法处理复杂任务FlowAgent 工作流 + 工具集成 + 多 LLM 协同落地难无代码构建 + 端到端交付 + 快速上线AI 人才不足可视化操作 + 专业支持 + 分钟级上手。

2025-12-05 11:57:56 946

原创 大模型应用理论那么简单,为什么实现起来那么复杂?

本文探讨大模型应用开发中理论与实践的差距,以RAG技术为例说明理解理论不等于掌握应用。RAG作为方法论而非具体技术,其难点在于效果优化而非流程实现。大模型应用开发需丰富经验和细节优化,不同模型和环境需针对性测试调整,效果优化比实现更难。很多人都有这样的感受——大模型应用的理论我都懂,但为什么就是做不好?其实理论的简单性和技术的复杂性,往往都隐藏在那些细节里。“纸上得来终觉浅, 绝知此事要躬行。今天闲的没事回头梳理了一下这大半年来开发过程中所遇到的问题,然后画了一个架构图;

2025-12-05 11:48:12 648

原创 智能体AI的六大核心设计模式,很常见!

本文详细介绍了六种主流AI智能体设计模式:ReAct的推理-行动循环、CodeAct的代码执行范式、Modern Tool Use的轻量级集成、Self-Reflection的自我评估、Multi-Agent的协作方案以及Agentic RAG的检索增强技术。这些模式从不同维度解决了智能体系统核心挑战,开发者可根据需求选择合适架构,构建更强大可靠的AI智能体系统。随着大模型技术的成熟,智能体正在从概念走向实际应用。

2025-12-04 15:46:45 1638

原创 几种AI Agent开发框架对比:相比手写代码是否更便捷?

通过以上对比来看,在日常智能体开发中,尤其是需要多轮对话、实现多工具调用和多智能体协作时,几种开发框架确实提供了极大的便利和扩展能力,大幅降低开发门槛和维护成本,而手写代码则适合高度定制化需求,灵活性最高。

2025-12-04 15:24:28 782

原创 想做能长期陪伴用户的Agent?你必须先搞懂记忆系统!

文章探讨了构建高级AI Agent的关键在于上下文工程而非仅提示词工程。成功Agent需理解自身身份(Context)、当前状态(Session)和长期记忆(Memory)。记忆系统应包含ETL流程:提取、整合、存储、检索和遗忘,并采用"Memory-as-a-Tool"机制。多Agent协作应共享Memory而非Session,同时需平衡RAG(世界知识)与Memory(个人知识)。最终,LLM的持续性取决于能否建立状态、积累经验、主动忘记,实现真正的"个体化"存在。

2025-12-02 15:32:10 820

原创 draw.io +ai agent,确实打开新思路!

本文详细介绍了AI Agent与draw.io绘图工具结合的两种方式:一是通过MCP标准协议实现对接,二是基于draw.io的二次开发。文章分别讲解了两种方法的安装配置、使用步骤和实际应用场景,帮助开发者快速掌握将AI能力集成到绘图工具中的技术,为未来AI在各软件场景中的应用提供了实践思路。又到年底了,又要必不可少的开始画图做PPT述职啦 😂,述职的好坏和年终奖都有可能挂钩!这对天天写代码大部分的程序员👨🏻‍💻来说是一件非常头疼的事,但好在这次可以使用个!

2025-12-02 13:52:25 2752

原创 Graphiti为AI智能体构建实时知识图谱, 从零基础入门到精通,看这一篇就够了!

Graphiti 是一个框架,用于构建和查询具有时间感知的知识图谱,特别适用于在动态环境中操作的 AI 智能体。与传统的检索增强生成(RAG)方法不同,Graphiti 能够持续地将用户互动、结构化与非结构化的企业数据以及外部信息集成到一个连贯的、可查询的图谱中。该框架支持增量数据更新、高效检索,并且可以精确地进行历史查询,而无需重新计算整个图谱,因此非常适合开发交互式、具有上下文感知的 AI 应用程序。使用 Graphiti 可以:•集成并维护动态的用户互动和业务数据。

2025-11-29 12:04:22 836

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除