- 博客(1257)
- 收藏
- 关注
原创 AI大模型强化学习完整指南:从零基础到精通,一篇掌握PPO到SAPO核心算法!
PPO, GRPO, DAPO, GSPO, SAPO 可以视作一条面向大模型强化学习微调的算法演进链:PPO 作为经典强化学习算法,在旧策略采样、clip 约束小步更新的框架下,让大模型可以稳定做策略梯度;GRPO 通过同一 prompt 下的样本组来估计 empirical advantage,省去了 Value Model 的训练开销;
2025-12-27 11:58:23
284
原创 一文搞懂LangGraph等工作流,太阳底下无新事!
本文系统介绍LangGraph框架构建AI Agent的方法,对比n8n与Dify等低代码平台,通过邮件处理Agent示例展示实现。探讨了可视化工作流在复杂生产环境中的局限性,指出低代码是探索起点而非生产终点,强调复杂场景仍需可编程框架结合严谨工程实践。在大模型(LLM)从“聊天玩具”迈向“生产力引擎”的进程中,如何可靠地指挥 AI 完成多步骤、多工具、带反馈的复杂任务,已成为构建下一代智能系统的核心挑战。
2025-12-27 11:53:41
497
原创 RAG检索增强生成教程(非常详细)从入门到精通,一篇就够了,建议收藏!
Naive RAG 是最基础的检索增强生成架构,采用“索引-检索-生成”的经典流程。
2025-12-25 11:34:14
794
原创 LangGraph 1.0教程(超详细+必藏)从零基础入门到精通,看这一篇就够了!
在之前的系列中,笔者已经系统梳理了 LangChain 1.0 的核心知识点,并通过一个 多模态 RAG 项目带领大家实践了 LangChain 1.0 的关键技术。从本篇开始,笔者将为大家进一步分享的相关知识。与 LangChain 1.0 相比,LangGraph 1.0 的整体架构变动不大,但其定位发生了重要转变:在 1.0 版本之后,LangGraph 不再是 LangChain 的能力延伸,而是成为 LangChain 的能力底座。
2025-12-24 10:34:29
879
原创 AI大模型思维模式详解:从零基础入门到精通,一篇掌握COT/TOT/GOT/AOT四种高级思维!
文章介绍了大模型的四种高级思维模式:COT(链式思维)、TOT(树状思维)、GOT(图状思维)和AOT(算法模仿思维),旨在克服传统"刚性分类"的局限性。COT适合线性推理任务,TOT通过多路径探索和选择最优解,GOT构建有向图实现灵活合并与迭代,AOT则模仿特定算法进行系统性搜索。这些思维模式能提升大模型处理复杂问题的能力,适用于从创意写作到算法优化等多种场景。
2025-12-24 10:22:28
820
原创 理解AI,看这一篇就够了!
AI的本质特征是泛化能力,使其能够触类旁通、填补知识缝隙并生成内容。然而,AI仅具备"临近泛化"能力,缺乏"远程泛化",因此能模仿写作但难以产生真正创意。这解释了为何AI更可能取代编码类工作而非需要远程泛化的文职工作。未来AI发展方向包括超越Transformer架构和开发专业领域AI,以增强泛化能力和解决特定问题。AI最本质的特点是什么?从哪一个点切入才能更全面、准确、深刻的理解AI?AI最核心的特点就是泛化能力,泛化能力是理解AI的入口。泛化就是触类旁通,举一反三。
2025-12-20 11:06:10
851
原创 一文详解AI编程工具选型指南(附10款+工具推荐)
AI时代,无论是AI产品,还是非AI产品,你都需要会使用AI编程工具。我们正处在AI快速发展的历史性跨越中。未来的核心竞争力,是你定义问题的清晰度和系统设计能力。在AI编程时代,我们不再是执行者,而是设计者。对于产品经理,从想法到实现的距离从未如此之短;对于开发者,从繁琐细节中解脱去攻克架构设计与核心算法的机会从未如此之多。种一棵树最好的时间是十年前,其次是现在。选择一款合适的AI编程工具,行动起来吧,去创造属于你的第一个App,第一个网站。
2025-12-20 10:46:09
666
原创 大模型Agent实战教程:应急管理智能问答系统从零构建到精通,一篇搞定!
本文详细介绍了基于LlamaIndex框架的应急管理安全生产智能问答系统构建方法。系统采用混合查询架构,结合RAG和Text2SQL技术,整合非结构化文档与结构化数据库数据。通过数据预处理、建立索引、智能检索、句子拆分和Agent工作流设计,实现精准的应急管理问答功能。项目解决了多数据源整合、复杂查询处理和结果质量评估等关键问题,为应急管理数字化转型提供了智能化解决方案。《应急管理安全生产智能问答》大赛是一个较典型大模型Agent实战项目,首先看下比赛的具体内容,然后再进行具体的分析和实战!
2025-12-19 11:53:50
898
原创 10分钟讲解 AI Agent(智能体)的底层逻辑,从零基础入门到精通!
在理解 Agent 的原理之前,我们首先需要知道什么是 Agent。这篇文章不会涉及任何晦涩的术语,力图给你最直观的理解。让我们回顾一下 AI 应用的发展历程。现在主流的 AI 技术叫做大模型(LLM)。大模型也叫大语言模型,顾名思义,它擅长语言(聊天),而且只会聊天。这也是为什么初版的 ChatGPT 和 DeepSeek 都只有一个聊天框,它们不过是把大模型的功能简单包装了一下。DeepSeek 只有一个简单的聊天框但是,如果 AI 只会聊天,那它能做的事情就非常局限。
2025-12-19 11:44:31
1798
原创 OpenAI又开源了!仅0.4B,给模型大瘦身
OpenAI研究团队的这项研究,标志着AI可解释性领域的一项重要突破,也印证了理解AI并非遥不可及的目标。研究团队在论文博客中称,这项工作是迈向更宏大目标的早期探索。接下来,他们计划将相关技术扩展至更大规模的模型,同时进一步解释更多模型的行为逻辑。为解决稀疏模型训练效率低下的问题,团队提出了两个后续研究方向:一是从现有密集模型中提取稀疏电路,替代“从头训练稀疏模型”的传统方式;二是研发更高效的可解释性模型训练技术,推动相关技术更易落地生产。
2025-12-18 13:58:29
613
原创 面向生产环境的LLM Prompt 优化:从零基础入门到精通,一篇全搞定!
文章介绍了四种提升LLM应用性能的技术:利用缓存token降低成本和延迟,将用户问题置于提示末尾提升回答质量,使用提示优化器改进提示结构,以及建立定制化基准测试选择最适合的模型。这些方法简单易行,能显著提高LLM应用的成本效益、响应速度和输出质量。大模型(LLM)能够自动化大量任务。自2022年ChatGPT发布以来,市场上涌现出越来越多利用 LLM 的AI产品。然而,我们在使用 LLM 的方式上仍有许多可改进之处。
2025-12-17 15:03:04
723
原创 为什么说多模态是推荐系统破局的关键?从基础到实战,一篇教程全掌握,值得收藏!
从这些工作可以看出,业界在多模态推荐的两大核心挑战上形成了不同的技术路线:基于ID交互关系对齐(快手QARM):适配现有推荐行为分布,但可能导致多模态特征退化;基于语义交互关系对齐(阿里妈妈):保持语义纯粹性,但可能脱离真实推荐场景;联合训练对齐(小红书AlignRec):通过深度融合平衡两者,但训练复杂度较高;量化编码(快手):将语义特征转化为可更新的语义ID,解决多模态表征更新问题;相似度分桶(淘宝):将连续相似度离散化为固定维度向量,简化使用方式;
2025-12-17 10:47:59
814
原创 大模型应用开发实战:从RAG踩坑到智能体优化,一篇搞定智能问答系统!
文章讲述了智能问答系统的开发与优化过程。作者最初采用纯RAG技术按场景建立三个知识库,但效果不佳,特别是在处理结构化与非结构化数据混合场景时。通过转变思路,改为按数据类型(结构化和非结构化)划分知识库,并设计相应的条件查询和相似度查询工具,成功解决了场景判断和查询效果问题,实现了更好的智能问答系统性能。大模型应用开发流程正确,但结果不一定正确。由于大模型技术的复杂性,再加上不同业务场景的特殊需求,导致大模型应用的开发难度很大;但大模型应用开发最难的不是做出来而是要做好。
2025-12-17 10:22:05
561
原创 AI Agent开发完全指南:从零基础到精通,MCP+PTC+Skills+Subagents一文搞定!
本文解析Anthropic三大Agent开发机制:MCP+PTC提供标准化工具访问和程序化调用;Skills以"知识胶囊"形式注入专业技能;Subagents实现"分而治之"的任务拆分。三者分别作为连接层、认知层和组织层协同工作,帮助开发者构建高效、可维护的Agent系统,拓展构建Agent系统的思维方式。Anthropic 这家“AI 后期之秀”擅长在 Agent 工程领域“整活”。(技能)与,并在自身的Claude开发平台落地支持。
2025-12-11 11:38:42
697
原创 Google开源了一个能操作电脑的智能体
谷歌开源的computer-use-preview项目是一个让AI直接操控电脑的Agent框架,采用三层架构设计,支持坐标归一化、截图滑动窗口等技术特点。通过自然语言驱动,AI可自主决定点击、输入等操作,但存在成本高、速度慢等局限性。该项目对构建AI智能体具有重要参考价值。嘿,大家好!这里是一个专注于前沿AI和智能体的频道~前两天,谷歌悄咪咪开源了一个叫的项目。可以让AI直接操控你电脑的Agent框架, 对标broswer_use。
2025-12-11 11:22:45
1229
原创 _大模型如何真正“记住”你:揭秘个性化AI Agent的技术底层框架
本文介绍了一个基于RAG的个性化框架,通过持久化记忆、动态用户画像和多智能体协作实现个性化能力。框架以LLM为中枢,实现中央协调、跨源检索、反思校验等六大模式,采用STM/LTM/用户画像等多层次记忆系统。实验表明该框架在检索准确率和回答正确率上优于标准RAG,尤其长对话任务提升显著。个性化评测应以检索命中、正确性、连贯性为主,解决冷启动与主动性问题是未来重点。RAG能搜资料,却很难认识你。这套框架用持久化记忆 + 动态用户画像 + 多智能体协作,把一次次聊天变成可累积的个性化能力。
2025-12-10 11:53:15
740
原创 AI大模型中的Token是什么?(超详细教程)收藏这篇就够了!
概念说明Token模型处理文本的最小单元(字节或子词)Tokenizer负责将文本拆分为 token 的工具模型的分词词典与算法定义可视化 token 分割的工具用途计费、控制上下文长度、文本分块等。
2025-12-08 21:06:38
1549
原创 AI大模型教程(超详细)从零基础入门到精通,Qwen-VL到Qwen3-VL全系列深度解析!
文章详细介绍了阿里云Qwen系列视觉语言模型的演进历程,从Qwen-VL到Qwen3-VL的架构创新与技术突破。包括基于Transformer的改进架构(RMSNorm、SwishGLU、RoPE),视觉编码器优化(2D-RoPE、NaViT),以及原生分辨率支持、多模态旋转位置编码(M-RoPE)等关键技术,不断提升模型对图像、视频的理解能力和计算效率。Qwen-VLQwenQwen-VLQwen2-VLNaViT 支持原生分辨率其它补充Qwen2.5-VLQwen3-VL整体结构。
2025-12-08 20:54:00
629
原创 注意力机制是什么?(Attention in Transformer)
对于人工智能(AI)中的神经网络结构,大多数人必定都略有耳闻,它来自神经生物学中“神经网络”的高度抽象,输入——传输——输出。不过,在AI模型中,“神经元”并非生物学上的细胞,而是用于存储和处理数据的容器;信息轴也不是电信号在突触上的传递,而是一系列数学函数对目标数值的有向变换。在传统的。
2025-12-06 15:26:14
937
原创 为什么我不再倾向于用Dify等智能体开发平台?
本文分享了Dify平台在AI应用开发中的实战经验。Dify能显著提升开发效率,让小团队能完成大公司的活,并使业务标准化。然而,在处理复杂业务逻辑、性能敏感场景和企业架构融合时存在局限性。作者提出"Dify+自研"的双模架构,并针对不同类型开发者提供差异化建议,强调在合适场景使用Dify的重要性。前言在转眼间,与Dify平台相伴已一年有余,为此写下的实战文章也逼近了80篇。从最初的好奇尝试,到如今的深度依赖,我想以一名老开发者的视角,分享这段旅程中的真实感悟。
2025-12-06 14:51:18
927
原创 AI大模型意图识别实战教程(超详细)从零入门到精通,一篇搞定!
意图识别核心在于 “针对性优化 + 持续迭代”。通过定期分析 bad case,定位未覆盖的表达场景、跨领域混淆点等问题,再通过补充数据、调整阈值、优化 prompt 等方式迭代。
2025-12-05 11:55:44
916
原创 智能体变笨了是什么原因?怎么优化?
本文详细分析了大模型智能体在多轮对话中出现的性能下降问题,并提出了四大优化方向:上下文长度调整、历史记录管理(控制在6-10轮对话)、提示词优化(明确职责和工具使用)以及工具优化(完善描述和参数验证)。文章强调智能体开发需要反复测试和实验,找到最适合的参数配置,从而提升智能体的质量和稳定性。大模型应用开发,做出来只是开始,做好才是能力。昨天在优化完智能体的记忆功能之后,今天做进一步的测试,然后就发现在多轮对话之后智能体好像变笨了;之前能够回答得很好的问题,现在有点失灵了。
2025-12-05 11:40:00
1633
原创 从RAG+MCP+Agent到企业落地,一篇精通!
文章阐述企业级AI架构三大核心组件:RAG提供企业内外知识访问能力,MCP实现业务工具调用执行能力,Agent整合前两者实现自主任务规划与执行。三者与LLM形成闭环,使AI从"能回答问题"升级为"能完成任务",是企业智能化落地的关键技术路径。如今企业都在“上LLM”,但很多企业落地后发现,只靠大模型:能聊天对话,但不能关联自己的企业数据;只靠 RAG(Retrival-Augmented Generation,检索增强生成):能查数据,但不会执行业务动作;缺少工具调用导致无法对接真实系统;
2025-12-04 15:51:50
746
原创 DeepSeek真的不如Gemini?
本文详细介绍了如何结合MediaMTX流媒体服务器和YOLO11计算机视觉模型实现AI视频实时处理与识别。MediaMTX负责视频流的接收、转换与分发,YOLO11提供目标检测等视觉能力。文章对比了两者的特性和应用场景,并提供了从拉流、推理到推流的完整处理管道构建方法,帮助开发者快速实现实时AI视频分析系统。最近去探查了一些 AI 视频的项目,在公司做了一个视频巡检的项目,我没想到 AI 写 AI 竟然会这么简单。这次 借助 Gemini 3 帮我完成的,来分享一下自己的思路。
2025-12-04 11:36:20
651
原创 Transformer架构完全指南(超详细图解)从零基础到精通,一篇顶十篇!
Transformer架构通过自注意力机制取代RNN实现并行计算,由输入模块、编码器、解码器和输出模块构成。编码器包含N个相同层,每层有多头自注意力和前馈网络,配合残差连接和层归一化;解码器在此基础上增加encoder-decoder注意力层。输入模块处理文本嵌入和位置编码,输出模块通过线性层和softmax生成最终预测。这种结构有效捕捉序列中的长距离依赖关系,成为现代大模型的基础架构。
2025-12-02 11:49:52
606
原创 AI大模型提示词宝典(超实用)从入门到精通,400+创意应用案例,收藏这一篇就够了!
本文分享了400+ Nano Banana Pro图片风格转换提示词及应用创意,涵盖食物美化、拆解图、发型生成、商品制作展示、穿搭、自拍、漫画创作和植物病虫害诊断等多个领域。作者强调优质提示词可转化为实用应用,并提供具体案例和详细提示词模板,帮助读者快速上手AI图像生成,创造有价值的产品内容。
2025-12-02 11:46:20
1253
原创 Agents 2.0从入门到精通,LangChain Deep Agents实战指南,建议收藏!
深度 Agent 的价值在于把“LLM 工具循环”升级为“可工程化的长期系统”:以规划—委派—持久记忆—人类在环为核心支柱,借助 LangGraph 的有状态编排与 DeepAgents 的中间件能力,支撑小时到天级的复杂任务,并提供可恢复与可观测。
2025-12-01 11:50:44
605
原创 深入AI Agent内核——Google gemini-cli的源码架构
从直观的能力演示到深入的源码剖析,我们一同拆解了 gemini-cli 的内部构造,并探讨了其背后的架构思想。至此,我们可以清晰地看到,gemini-cli 不止是一个功能丰富的命令行工具,它更是一个关于如何构建AI Agent 、有价值且可供参考的工程范例。
2025-12-01 11:35:58
691
原创 AI大模型实战教程(超详细)从零基础到项目实战,一篇收藏,小白程序员入门必看!
文章分享了大模型应用开发从小白到入门的心路历程,经历了从简单调接口到理解开发流程,再到发现流程正确但结果不理想的阶段,最终认识到真正入门需要理解大模型能力并与业务需求相结合。作者强调,理解大模型基本能力并将其与业务需求结合是开发人员应具备的基础能力。大模型应用开发从小白到真正入门,需要理解大模型的基本能力,还要理解怎么和业务需求相结合。真正从事大模型应用开发到现在,差不多有一两年时间了;
2025-11-29 12:01:44
1034
原创 【实战】基于Dify智能体开发平台开发一个目标检测智能体
本文详细介绍了基于Dify智能体开发平台的目标检测模型从训练到业务落地的全流程。通过小南瓜平台上传样本并生成训练数据,配置模型训练参数获取模型地址。在Dify中搭建智能体,使用HTTP节点处理图片上传和模型调用,通过LLM节点汇总检测结果。测试验证了模型在识别不同数量目标物品及无目标场景下的准确性,展示了目标检测技术在真实业务中的应用价值。本文我们将基于Dify智能体开发平台讲解目标检测小模型从训练到实际业务落地的全流程本文假设你对Dify智能体开发平台和小南瓜开发平台已有基本的了解一、业务需求。
2025-11-29 11:33:39
661
原创 别再混淆了!RAG、LangChain与Agent的真实关系
本文深入解析了RAG、LangChain和Agent这三大AI技术的本质区别与协同关系。RAG作为知识库扩展技术,LangChain作为开发框架,Agent作为智能应用形态,三者各司其职又相互配合。文章结合企业级项目经验,详细阐述了三者的技术实现、落地难点和最佳实践,帮助开发者避免技术选型误区,构建高效稳定的企业级AI应用。这是个极具代表性的问题——过去十八个月里,无论是刚入行的算法工程师,还是从传统开发转型AI的技术人,几乎都问过我同样的困惑。
2025-11-29 11:16:19
762
原创 AI大模型实战指南(珍藏版)从零基础到项目落地,一篇全掌握,赶紧收藏!
文章分享了企业成功落地AI智能体的6条核心经验:重构人机协同流程,精准匹配应用场景,系统性培养AI能力,建立全程监控机制,构建能力中台实现复用,以及实现人机协作的价值升级。强调AI落地应以"价值思维"而非"技术思维"为导向,通过流程重构、场景匹配、能力培养等方式,真正实现AI技术与业务价值的融合,提升企业业绩。一位制造业老板曾向我吐槽:“花200万上了AI智能体,客服嫌难用、技术喊维护累,三个月只省了几个录入岗,连投入零头都没赚回。这不是个例。
2025-11-28 13:52:17
779
原创 大模型Agent业务落地:少即是多的减法艺术(图解+代码)大模型Agent业务落地:少即是多的减法艺术(图解+代码)
做 Agent 不是“加法竞赛”,而是“减法艺术”。把信息、工具、流程都减到“必要且充分”,再用文件系统把“长材料与中间态”卸载到对话之外——你的 Agent 会更稳、更快、更省,也更容易在真实业务里长期留存与复用。Less, but better. 先做减法,再谈进化。
2025-11-28 11:52:01
319
原创 AI Agent 正在重塑一切:从“执行命令”到“完成目标”
在过去,我们使用 ChatGPT 时,我们扮演的是“老板”,而 ChatGPT 是“实习生”。
2025-11-27 13:47:25
1031
原创 别再瞎选了!3分钟带你彻底搞懂Dify、Coze、n8n的区别
*具体来说,工作流(Workflow)**是一组由多个节点按特定顺序编排而成的可执行指令集合,旨在实现特定业务逻辑或完成既定任务。随着AI技术的不断发展,为降低AI技术的使用门槛,基于图形用户界面(GUI)的零代码或低代码节点式AI工作流框架逐渐兴起。本质上,GUI节点式工作流 = 可视化 DAG 编排 + 零/低代码封装 + 及时执行。
2025-11-27 11:13:24
492
原创 用LangChain搭建智能客服,从零基础入门到精通!
LangChain大大降低了大模型应用的门槛,让你不再需要从零写复杂代码,而是专注于业务逻辑的设计。无论你是想做智能客服、自动报表生成、还是内部知识助手,都可以用这个框架快速实现。
2025-11-25 15:37:24
1030
原创 一文读懂谷歌最强大模型Gemini_3:下半年最大惊喜!
本文详细分析了Google最新发布的Gemini 3大模型,它在基准测试中全面超越GPT-5等竞品,展现出强大的多模态理解、编码能力和Agent功能。Gemini 3在前端生成UI方面取得突破,成为首个融合通用Agent能力的产品,标志着Google在AI领域的强势回归。其性能提升证明Scaling Law依然有效,预示AI正从聊天机器人时代向数字同事时代转变,为用户提供了更强大的AI助手体验。
2025-11-25 15:11:56
1149
原创 自动化知识图谱构建全攻略(超详细)从零基础到专家级应用,收藏这一篇就够了!
"灵丹0"自动化知识图谱构建系统通过LLM实现数据发现、智能建模、一键抽取评估入库,支持自然语言描述任务,无需专业知识。系统能智能定位有价值数据,自动设计模型,抽取知识图谱并导入本地neo4j,大幅缩短项目周期至少4周+,完全本地实现确保数据安全。过去2年!雄哥做了大量的MAS+知识图谱内容!从最靠基本功的文档预处理、LLM抽取、评估消歧、高速通道入库!我们发现,每个项目任务不同,所需知识不同,数据处理的方法也,全不相同!这!无法标准化交付!于是,雄哥想,有没有通用的+自动干活的方案?
2025-11-22 11:56:53
695
原创 告别微调!腾讯提出Training-Free_GRPO:从零基础入门到精通,收藏这篇就够了!
Training-Free GRPO模仿传统GRPO的多轮学习机制,但完全不更新模型参数。其核心是维护一个经验知识库,在每轮迭代中,模型根据当前经验生成多个答案,评估它们的质量,并总结出“成功经验”或“失败教训”,更新到知识库中。后续查询时,模型会参考这些经验,从而提升表现。上图对比了传统GRPO与Training-Free GRPO的流程。传统GRPO通过梯度更新参数,而Training-Free GRPO通过更新上下文中的经验库来实现优化。新范式。
2025-11-22 11:30:19
949
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅