- 博客(1568)
- 收藏
- 关注
原创 收藏级干货:拆解AI Agent核心能力,助你成为Agent流程架构师
本文通过"学霸成长"比喻和旅行规划案例,深入解析了AI Agent从Chatbot进化的本质。Agent能力的质变源于设计的"认知流程"而非模型智力提升,体现在三重价值:用结构为思考建立脚手架,用迭代为记忆打造压缩算法,用交互为模型连接现实世界。文章从控制论和信息论角度阐释了Agent有效性的科学基础,并指出开发者角色正从"提示词工程师"转变为"Agent流程架构师",未来需关注性能工程和高级认知架构的构建。
2026-03-03 19:23:52
133
原创 【收藏必备】大模型Agent开发实战全攻略:从零构建会思考能执行的智能体
本文深入解析AI Agent开发架构与实践,详细介绍规划、记忆、工具调度等核心模块实现,分享基于function call和MCP协议的Agent搭建方法及多Agent协作系统设计。作者结合两年实战经验,提供构建"会思考、能执行"智能体的完整技术路径与架构认知,是开发者入门Agent开发的必学指南。
2026-03-03 19:22:15
290
原创 智能问数Agent架构深度解析:从Dataset到Semantic Layer,程序员必看收藏指南
文章分析了智能问数Agent的两种设计路线:基于Dataset的传统BI增强方案和基于Semantic Layer的指标中心化方案。前者强调快速落地与改造成本,后者注重统一语义资产与长期治理能力。前者适合数据建设早期/中期企业,后者适用于数据治理成熟期/规模化阶段。文章提出可采用渐进式演进策略,先以Dataset架构起步,逐步向语义层架构演进,两种模式可在并行存在中自然过渡。
2026-03-03 19:20:42
218
原创 【程序员必学】RAG系统性能提升秘诀:文本分块技术全解析
本文详细介绍了文本分块作为RAG系统核心技术的关键作用,包括降低检索噪声、减少AI幻觉和缓解上下文丢失。文章系统阐述了五种主流分块策略(固定大小、语义、滑动窗口、反向和Agentic分块),并指导开发者如何根据内容结构、查询类型等因素选择合适方案。最后探讨了分块在企业级应用中的挑战与解决方案,强调分块是RAG系统成败的结构基石,直接影响检索精度和系统性能。
2026-02-26 13:31:16
257
原创 3微秒启动,6.5KB内存:Agno框架让AI智能体开发性能飙升
Agno是一款高性能多智能体系统运行时,以极速(启动3μs,内存6.5KB)、安全和开箱即用为特点。它超越LangGraph等框架,自带FastAPI应用模板和Web控制平面,实现数据主权,极简API让复杂任务仅需10行代码。短短数月GitHub Star突破36.1k+,成为企业级AI应用新宠。
2026-02-26 13:29:34
409
原创 收藏级干货:彻底搞懂MCP、RAG、Agent:AI技术的黄金三角,从小白到专家只需这一篇!
文章介绍了AI领域三大热门概念:MCP(统一接口的"万能转换器")、RAG(解决AI幻觉的"知识大脑")和Agent(主动干活的"智能助理")。这三者形成"黄金三角",MCP负责连接各种工具和知识源,RAG提供准确的知识支持,Agent则主动理解和执行任务。它们的组合正在让AI进化为真正的"智能助手",未来可能渗透到生活各个角落,掌握这些概念有助于跟上AI时代步伐。
2026-02-26 13:27:51
396
原创 从零掌握卷积神经网络(CNN):小白必学的图像处理核心算法
卷积神经网络(CNN)是专为处理网格结构数据的深度学习模型,通过局部感受野、权值共享和下采样提取层级特征。其基本结构包括卷积层、激活函数、池化层和全连接层。相比传统全连接网络,CNN显著减少参数量,保留空间结构信息,广泛应用于图像识别、目标检测等领域。文章提供了PyTorch实现的手写数字识别案例,展示了CNN的实际应用。
2026-02-26 13:26:35
439
原创 【干货收藏】LLM-RL训练框架深度剖析:四大主流框架架构设计与实战选型指南
本文深度剖析了LLM-RL训练的挑战与架构演变,系统解构了TRL、OpenRLHF、verl、LLaMA Factory四大主流开源框架的架构设计、关键特性及适用场景。通过横向评测,从性能、易用性和硬件需求三个维度提供选型建议,帮助开发者根据自身需求选择合适的框架,并展望了LLM-RL训练框架的未来发展趋势。
2026-02-24 18:43:31
708
原创 大模型开发必备:Langchain框架全面解析
文章介绍了Langchain这一大模型代理框架,详细阐述了其核心组件包括agent、tools、memory、model、messages和middleware。文章提供了环境准备指南,包括Python环境配置、模型选择和API设置,并通过一个实例演示了如何创建和调用agent。最后介绍了Langsmith部署方法,帮助开发者可视化整个执行流程。该框架通过整合各大模型厂商接口,为开发者提供了便捷的大模型应用开发工具。
2026-02-23 20:23:11
1027
原创 【建议收藏】大模型的“寒窗苦读“与“应用实践“:训练与推理详解
文章解析了大模型的训练与推理两大核心过程。训练包括预训练(自监督学习海量数据掌握基础能力)和后训练(微调与RLHF教会模型遵循指令)。推理则是实际应用阶段,包含输入处理和迭代生成。训练是一次性高成本投入,创造模型能力;推理是持续交互环节,使用模型能力。两者共同构成大模型完整工作流程。
2026-02-23 20:22:04
819
原创 收藏必备!Agent Skills让AI告别“短期失忆症“,实现能力复用新范式
Agent Skills是Anthropic推出的创新技术,解决了AI智能体的"短期失忆症"问题。它将复杂任务流程固化为可复用的"技能组件",通过三层渐进式加载机制和标准化文件结构,使AI能长期保存和使用知识,无需每次对话重新解释。这一技术不仅提高了AI工作效率,还重塑了AI开发生态,让"能力复用"成为新常态,是AI时代核心竞争力的重要组成部分。
2026-02-23 20:20:35
633
原创 带你破局AI Agent:MCP与A2A定义安全新边界
为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单,这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张,也让人才供需矛盾愈发突出。
2026-02-19 14:12:10
862
原创 【AI大模型】10分析带你彻底搞懂大模型 - Agent(智能体)
本文介绍了基于大语言模型(LLM)的AI Agent技术及其应用。LLM Agent由规划、记忆、工具和行动四大模块组成,能够模拟人类思维过程完成复杂任务。重点探讨了LLM Agent与检索增强生成(RAG)技术的结合,展示了如何构建财报分析Agent系统,包括需求分析、架构设计、数据获取、知识检索等关键环节。文章还指出AI人才需求激增的市场现状,并提供了大模型学习资源包,包含视频教程、技术文档、面试题解等资料,旨在帮助读者快速掌握AI大模型技术。
2026-02-19 14:10:26
559
原创 大模型记忆机制深度解析:它是如何记住你的?
本文探讨了LLM记忆系统的核心机制与实践路径。记忆系统本质上围绕"抽取"和"检索"两大模块展开:抽取层负责从对话、日志等多源输入中提炼有价值信息,通过语义压缩形成长期记忆;检索层则根据当前上下文动态召回相关记忆。关键发现包括:1)对话文本是最优记忆输入源;2)记忆需要支持动态更新与遗忘机制;3)存储形态决定系统能力边界;4)检索是迭代优化的过程。目前业界正通过不同方式(如ChatGPT的用户记忆、Claude的显式技能记录等)探索记忆系统的产品化路径,其终极目标是形成
2026-02-19 14:09:06
671
原创 万字解析:归一化!从Transformer归一化到主流大模型归一化的演变!
摘要 本文系统介绍了归一化(Normalization)在深度学习中的作用和常见类型。归一化通过将数据限制在固定范围内,解决数据可比性问题,提高模型训练效率和稳定性。主要作用包括:消除量纲差异、加速梯度下降收敛、缓解梯度消失问题以及减少内部协变量偏移(ICS)。常见的归一化方法分为线性(Min-max、Z-score、Mean)和非线性(对数、反正切、小数定标)两类,各自适用于不同数据分布场景。文章特别指出,在Transformer等现代神经网络架构中,归一化技术对模型训练至关重要,尽管其实现方式相对简单,
2026-02-19 14:07:39
470
原创 2026全网最详细的AI大模型学习路线!AI大模型应用开发终极学习路线图!
本文提供2026年AI大模型应用开发的系统化学习路线,分为七个阶段:大模型基础、RAG架构、LangChain应用、模型微调、Agent开发、边缘部署和多模态技术。路线涵盖提示词工程、向量数据库、微调方法、Agent框架等核心内容,配有实战项目和代码示例。适合从入门到进阶的学习者,帮助开发者全面掌握AI大模型应用开发技能,提升职场竞争力。
2026-02-19 14:06:12
785
原创 2026校招残酷真相:两个同班程序员,一个死磕传统开发,一个入门大模型,毕业起薪可能差3倍!
摘要: 随着AI大模型技术爆发,高科技企业成为AI人才招聘主力,2026届校招中近60%企业将AI岗位列为核心需求。大模型相关岗位薪资领跑行业,算法工程师月薪中位数超2.4万元。政策加持下,AI人才缺口预计2030年达400万,覆盖算法研发、应用落地等多元方向。零基础者可系统学习大模型技术,资料包含教程、路线图、面试真题等资源,助力抓住职业风口。 (字数:150字)
2026-02-19 14:03:34
949
原创 2026年大模型转行实战指南:4大方向选择与落地路线,实现成功转型!
站在现在回头看,会发现一个有趣的现象: AI 大潮滚滚 2 年,流量的风向能变,岗位的 JD 能变,各家模型能天天更新,**但真正能落地的东西,并没有变。
2026-02-15 21:20:20
584
原创 【AI大模型部署】教你快速本地部署AI大模型!
随着人工智能(AI)和机器学习(ML)技术的迅猛发展,AI模型的规模和复杂度也在不断增加。这些大规模模型,如大型语言模型(LLMs)、计算机视觉模型和复杂的推荐系统,通常需要大量的计算资源来训练和推理。云计算平台提供了便捷的解决方案,但本地部署AI大模型有其独特的优势和必要性。
2026-02-15 21:18:08
911
原创 【AI大模型】15分钟深度解析AI Agent 与 AI Workflow :从自动化到智能化的演进
在人工智能技术快速迭代的今天,我们正见证着 AI 应用模式的多元化发展。其中,AI Agent 和 AI Workflow 作为两种截然不同的范式,正在重塑我们对 AI 应用的认知。这两种模式就像是同一枚硬币的两面 —— 一个追求灵活创新,另一个注重稳定高效。
2026-02-15 21:13:47
696
原创 万字解析!最通俗易懂的Transformer模型架构详解!(图文并茂)
RNN 和 LSTM 已经在时序任务方面有了广泛的的应用,例如像文本预测、机器翻译、文章生成等等,但是这些应用都面临着如何记录长期依赖的问题,而使用 Transformer 架构就能解决这类问题。
2026-02-15 21:10:23
881
原创 10分钟带你深度解析多模态RAG:揭秘AI新技术
多模态检索增强生成_(Multimodal Retrieval Augmented Generation,简称RAG)_是一种新兴的设计范式,允许AI模型与文本、图像、视频等多种信息存储接口进行交互。
2026-02-15 21:06:38
641
原创 大模型MoE架构解析!(含DeepSeek MoE详解),建议收藏起来慢慢看!!
混合专家模型 (Mixed Expert Models,简称 MoEs) ,最早是随着 Mixtral 8x7B 的推出而逐渐引起人们的广泛关注。最近随着DeepSeek的爆火,MoE又进一步引起大家的关注。本文作者将带你了解 MoEs的发展史、核心组件、训练方法,推理中各因素考量和DeepSeek MoE详解。
2026-02-15 21:04:32
826
原创 掌握RAG核心技术:知识库处理、高效召回与图谱检索 | 大模型学习必备收藏
文章介绍了RAG高级技术与调优的系统方法,主要涵盖三大方向:知识库处理(问题生成、对话沉淀、健康度检查、版本管理)、高效召回(查询扩展、混合检索、重排序、其他策略)和图谱检索(GraphRAG)。通过这些技术可以显著提升RAG系统的检索准确率和性能,为构建高质量的大模型应用提供支持。
2026-02-10 13:22:00
419
原创 AI大模型入门指南:Agent、Workflow和MCP概念详解,收藏学习不迷路
文章详解AI三大核心概念:Agent(自主决策AI程序)、Workflow(固定流程自动化工具)和MCP(AI调用外部能力协议)。三者互相配合:MCP解决连接问题,Workflow串联任务,Agent处理复杂决策。文章分析各自特点、适用场景及组合方式,帮助开发者根据需求选择合适架构,为AI应用开发提供指导。
2026-02-10 13:20:50
360
原创 大模型智能体设计模式:21种核心模式详解,助你成为AI专家
本文系统介绍AI智能体的基本概念、特性、执行步骤与等级划分,详述21种设计模式包括提示链、路由、并行化等,并展示如何组合这些模式构建复杂系统。文章揭示了智能体从LLM演化而来的技术演进,强调多模式组合而非单一应用的设计理念,为开发者提供构建自主智能体的体系化工具箱,适合大模型学习与实践参考。
2026-02-09 13:09:30
934
原创 【收藏学习】向量数据湖赋能Context Engineering:RAG到Agent的技术演进
文章探讨了从传统RAG到Context Engineering的技术演进,指出AI应用正从单轮问答向多轮Agent发展。Milvus提出的向量数据湖通过湖仓一体架构,统一管理多模态上下文数据,支持混合搜索、多模态处理和动态管理。其创新包括存算分离、多引擎协同和智能冷热分层,解决了数据孤岛与扩展瓶颈,为下一代AI应用提供高效、灵活、可扩展的上下文基础设施。
2026-02-09 13:08:19
728
原创 Java开发者转型AI Agent:从入门到精通(完整指南,建议收藏)
本文为Java开发者提供AI Agent转型指南,系统介绍AI Agent概念、与工作流的区别、核心组件(LLM、工具、记忆)及ReACT框架。详细解析工作流模式与Agent模式,深入探讨多Agent架构。文章不卖课,提供实用知识,帮助读者理解何时使用Agent、如何构建系统及避免常见陷阱,适合希望进入AI领域的Java开发者学习收藏。
2026-02-09 13:06:57
1078
原创 收藏!6种多智能体架构模式,破解AI“单体智能体墙“性能难题
本文探讨AI"单体智能体墙"现象,即单个智能体在超过10-15个工具后性能断崖式下跌的问题。文章提出6种多智能体架构模式:顺序流水线、并行扇出、层级监督、路由分发、反思迭代和共识投票,分别适用于不同场景。设计多智能体系统应像管理团队而非写代码,先从单体开始,逐步升级。多智能体系统已成为2026年复杂AI任务的事实标准,能有效解决单智能体的指令迷雾和工具过载问题。
2026-02-05 13:34:05
528
原创 多智能体系统的核心秘诀:Agent交接机制详解,从原理到落地,收藏级学习指南
文章详细解析了多智能体系统中的Agent交接机制,这是解决单个智能体能力边界不足的关键。文章介绍了交接机制的三大分类(自主直连式、规则触发式、Supervisor管控式),重点阐述了Supervisor管控式交接的四步实现流程(触发判断、交接准备、执行交接、后续协同),以及三大核心设计要点(标准化、无状态化、可追溯)。同时提供了典型问题解决方案和不同架构下的落地适配,为企业级多智能体系统落地提供实用指导。
2026-02-05 13:32:55
900
原创 大模型搜索Agent核心架构:拆分与评估两大问题解决方案(收藏版)
本文系统介绍了深度搜索Agent的架构演进:从基础迭代式Agent到并行工作流,再到动态拆分问题的Planner-Only架构,以及加入评估反馈的双模块设计。详细讲解了停止条件处理、澄清问题机制和检查清单评分等评估方法,最后介绍了Sentient Labs的递归式ROMA架构。文章强调不同架构适用于不同场景,建议从简单架构开始,逐步叠加模块,根据具体问题选择合适方案。
2026-02-05 13:13:41
827
原创 RAG系统大对决:让AI自己做决策真的更香吗?Enhanced vs Agentic全方位实测揭秘!
文章对比了Enhanced RAG与Agentic RAG两大系统在用户意图处理、查询改写、文档优化和模型影响四个维度的表现。研究发现:窄域任务中Agentic更优,开放域任务Enhanced更稳定;查询改写环节Agentic平均提升2.8个NDCG点;文档精选时Enhanced重排序效果更好;Agentic成本是Enhanced的3-4倍。建议根据场景、预算和需求选择架构,或考虑混合方案。
2026-02-04 18:22:28
887
原创 Anthropic大模型Agents构建全攻略:从理念到实践的极简指南
Anthropic团队分享了构建高效LLM Agents的设计理念,强调"实用优先、简洁可控、按需适配"的逻辑。核心原则包括:最小复杂度优先,架构按需匹配,模块化可组合,透明可控,以及人机协同。文章详细介绍了从增强型LLM基础块到workflows和Agents的构建方法,并提供了客户支持和编码两个实用场景的最佳实践,帮助开发者打造功能强大且可靠可维护的Agents系统。
2026-02-04 18:20:48
544
原创 企业AI Agent频频失败?本体论解决方案揭秘,小白也能轻松掌握
本文分析了企业AI Agent项目失败的核心问题:尽管拥有数据却依然"盲目",现有工程手段仅能局部"止痛"。文章提出本体论作为关键解决方案,通过构建企业"语义层"统一概念与关系,支撑复杂推理,减少误解与幻觉。最后详解构建本体的6块核心积木,为读者提供了从理论到实践的完整指南。
2026-02-03 13:17:35
918
原创 RAG调优全攻略:解决大模型知识库检索难题,从入门到精通的实战指南
本文深度解析了RAG系统从基础到高级的调优全流程,包括知识库的精耕细作(检索优化、对话沉淀、健康度检查)、高级召回与排序技术(混合检索、重排序、查询扩展)以及GraphRAG架构解决复杂查询问题。文章指出RAG系统优化应分阶段实施:起步期引入混合检索,成熟期加入重排序和查询改写,巅峰期部署GraphRAG,并需在准确率与响应时间间进行权衡,以适应不同业务场景需求。
2026-02-03 13:14:25
805
原创 【干货收藏】AI Agent部署完全指南:四种形态选择与最佳实践
文章详细介绍了AI Agent的四种主流部署形态:批处理式(Batch)、流式(Streaming)、在线服务型(Real-time)和端侧(Edge)。每种部署方式都有其典型特征、架构形态、应用场景及优缺点。核心观点是AI Agent的部署方式决定了其功能定位,而非仅依赖模型能力。成熟的Agent系统往往是多种部署方式的组合,选择正确的部署形态对Agent的成功落地至关重要。
2026-02-02 20:29:01
935
原创 一文搞懂大模型三大推理框架:CoT、ReAct、ToT从入门到实战
ReAct、CoT、ToT是大模型三大推理框架,分别代表线性推理、推理+行动闭环、多分支探索的进阶路径。CoT适合简单推理问题,ReAct是AI Agent核心框架支持工具交互,ToT实现高阶树状推理解决复杂问题。开发者可根据任务复杂度、成本和模型能力选择框架,ReAct+CoT是当前工业界"黄金组合",ToT则是未来发展方向。
2026-02-02 20:27:35
920
原创 35岁Java程序员的AI逆袭之路:从被优化到年薪40万的大模型专家
35岁Java程序员老李被公司优化后,通过系统学习AI大模型技术,将Java与AI结合开发智能推荐系统,成功实现职业转型。他从零开始学习Python和机器学习,掌握深度学习框架,最终成为AI大模型开发工程师,薪资翻倍达40万。文章证明,在AI时代,Java程序员只要勇于学习新技术,年龄不是障碍,完全可实现职业逆袭和高薪梦想。
2026-02-02 20:26:34
854
原创 一文弄懂AI“幻觉“是什么?收藏!AI产品经理必备的5大解决方案
本文深入解析大模型"幻觉"现象,包括其定义、类型及产生原因。系统介绍5种核心解决方案:RAG检索增强、模型微调、提示词工程、多模型验证及外部规则系统,并提供AI产品经理在实际项目中落地防幻觉体系的完整框架,帮助构建可控、可预测的AI产品。
2026-01-31 13:11:15
840
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅