- 博客(1590)
- 收藏
- 关注
原创 【精华收藏】大模型是如何推理的?AI对话背后的技术原理详解
文章全面解析了大模型推理的完整技术流程,包括文本分词与词嵌入、位置编码、Transformer架构、Prefill与Decode两个推理阶段、KV缓存技术、模型量化方法等。同时介绍了主流推理框架(vLLM、TensorRT-LLM等)及性能监测指标(TTFT、TPOT、吞吐量等),帮助读者理解从用户输入到AI回复输出的整个技术链条。
2026-03-27 13:19:58
257
原创 【深度收藏】Agent狂潮下,检索模型为何依然重要?RAG技术三大学习方法详解
文章探讨了在Agent系统快速发展的背景下,检索模型依然具有重要性。作者介绍了三种检索嵌入模型的学习方法:成对余弦嵌入损失、三元组边距损失和InfoNCE损失。指出检索模型的准确性直接影响Agent系统的效率和成本,并比较了三种方法的优缺点,认为选择哪种方法取决于具体场景、数据量和算力。InfoNCE覆盖面最广,而余弦嵌入损失在精细调整后也能达到相似效果
2026-03-27 13:18:53
207
原创 【深度收藏】从“手“到“说明书“,一文看懂AI Agent的Function Calling、MCP和Skills
文章通过"手"、"接口"和"说明书"的比喻,解析了AI Agent开发的三大核心概念:Function Calling作为AI与外部交互的"手",解决人机语言不通问题;MCP作为通用"USB接口",标准化工具集成;Skills作为"操作手册",用自然语言定义复杂流程。最终提出Func-Agent理念,主张将Agent能力封装为标准函数接口,兼具AI灵活性和传统软件稳定性。
2026-03-27 13:17:31
401
原创 【深度收藏】业务流程、工作流与AI Agent:不是替代,而是融合进化的新范式
文章解析业务流程、工作流、Agentic Workflow、AI Agent和Agent Skills五大概念的关系,强调它们不是替代而是融合。业务流程作为企业骨架不会消失但会进化;工作流将其数字化;AI Agent是自主思考的执行者;Agent Skills是其工具箱;Agentic Workflow是指挥系统。未来趋势是人机协作,人类从操作工变为决策者,技术从僵化变为灵活,实现人的解放。
2026-03-27 13:16:02
388
原创 保姆级教程:Langchain框架详解 - 大模型开发者的必备技能
本文介绍了Langchain框架,这是一款整合各大模型接口的代理工具。文章详解了其核心组件(agent、tools、memory、model等),环境准备工作,以及如何快速入门Langchain(安装、初始化、创建和调用agent)。最后介绍了Langsmith部署方法,帮助开发者从零开始构建大模型应用。
2026-03-27 13:14:00
235
原创 【程序员必学】主动智能系统架构设计:从工具层到RAG的完整指南
文章介绍了主动智能系统的三层架构(工具层、推理层、行动层)及工作流程,强调模块化设计通过子智能体提高系统性能和准确性。探讨了智能体间的交互机制,以及数据检索和RAG技术在连接大语言模型与所需数据方面的关键作用,确保系统能提供新鲜、相关信息。
2026-03-27 13:12:50
458
原创 程序员AI入门必读:用公司招人故事讲透LLM、Agent等7大核心概念
文章以"开公司招AI员工"的故事形式,通俗易懂地讲解了AI领域的7个核心概念:LLM(知识渊博但只会接话的天才)、Prompt(精准指令)、Agent(自主决策的助理)、Skill(专业技能手册)、MCP(万能工具接口)、IDE(协作办公室)和Claude Code(命令行热线)。这些概念构成了AI从基础到应用的完整路径,帮助读者理解AI产品本质,破除技术术语壁垒,适合AI初学者系统学习。
2026-03-24 10:00:47
296
原创 Skill设计:AI产品经理的核心能力,决定Agent质量上限
文章澄清了AI产品中Agent与Skill的关系,强调Skill才是核心而非附属品。Skill是标准化任务执行模块,包含触发条件、输入规范、执行逻辑等要素,定义了Agent如何执行任务。Agent仅是Skill的运行容器。AI产品经理的核心工作应是设计高质量Skill,这决定了Agent输出质量。从写Prompt到设计Skill,是AI产品经理进阶的关键一步。
2026-03-24 09:59:25
1054
原创 【收藏必备】LangChain与LangGraph从入门到精通:构建生产级AI Agent工作流完全指南
本文全面解析了LangChain与LangGraph两大框架,从基础概念到实战应用。LangChain作为LLM应用快速开发框架,适合简单场景和快速原型;而LangGraph作为状态机驱动的Agent编排框架,支持复杂工作流、状态持久化和多Agent协作,更适合生产级系统。文章详细介绍了两者的核心组件、适用场景、选择建议,并通过实战案例展示了如何构建智能系统,为AI工程师提供了完整的学习路径和最佳实践。
2026-03-24 09:57:46
408
原创 收藏必看!从零开始掌握大模型Skills:让你的AI编程效率提升10倍的实战指南
Skills是基于"中台"思维的公共Prompt集合,通过复用高频编程提示词提升AI辅助编程效率。文章提出Skills设计应采用"恰好而非更多"的渐进式披露理念,并分享了从归纳法到演绎法的开发方法,以及逆向建模、问题定位等实际案例。Skills实现了经验的低成本共享,使AI能够通过基础Skills组合解决复杂问题,标志着系统设计从面向人转向面向AI。
2026-03-24 09:56:30
346
原创 【必收藏】小白也能看懂的ReAct Agent实战指南:从写流程到造智能体的跃迁之路
本文深入浅出解析ReAct Agent核心原理,通过"观察-思考-行动"循环模式,让AI像人类一样动态解决问题。文章详细介绍了历史上下文、环境信息、LLM推理、工具调用和观察结果五大关键要素,并通过实际案例展示ReAct如何灵活应对复杂任务,帮助开发者从传统编程思维跃迁到智能体构建,提供了从入门到实战的完整指导。
2026-03-19 19:21:49
317
原创 【收藏必备】AI Agent存储革命:从S3到Agent Bucket,30分钟构建百万级用户应用的完整指南
文章介绍了Agent Bucket,一种专为AI Agent设计的新型对象存储解决方案。传统对象存储在多租户场景下面临扩展性差、隔离不足等问题。Agent Bucket创新性地引入ObjectSet概念,为每个终端用户提供专属数据空间,实现原生隔离、权限控制、监控计量等功能,并通过Set Tagging、Set Slice和Set AccessPoint等设计解决了海量用户管理难题,为AI Agent开发提供高效、安全的存储基础设施。
2026-03-19 19:20:49
307
原创 收藏必备!一文详解Agent Skills:让AI告别“短期失忆“,实现技能复用
Anthropic推出的Agent Skills技术解决了AI智能体的"短期失忆症"问题,通过将任务流程固化为可复用技能组件,使AI能够按需调用能力,无需重复训练。该技术采用渐进式披露机制和标准文件结构,支持技能组合和跨平台使用,为AI开发提供了模块化、可复用的解决方案,大幅提升开发效率,重塑了AI开发生态。
2026-03-19 19:20:01
375
原创 【必看收藏】从传统编程到AI Agent:一文读懂三种开发方式的本质区别
文章深入对比了传统编程、Workflow工作流和AI Agent三种开发方式的本质区别。核心差异在于决策者不同:传统编程由程序员预先设计所有逻辑;Workflow通过图形化方式实现固定流程;而Agent由AI动态决策,能处理不确定性和复杂场景。Agent显著降低了开发门槛,实现了业务自闭环,不是简单替代传统编程,而是开辟了新的应用范式。
2026-03-19 19:18:56
399
原创 【必看收藏】一文看懂业务流程、工作流、Agentic Workflow、AI Agent、Agent Skills的关系与区别(附学习指南)
文章分析了业务流程、工作流、Agentic Workflow、AI Agent和Agent Skills的区别与联系,指出它们是融合发展而非相互替代。业务流程是企业骨架,工作流将其数字化,Agent是智能执行者,Skills是其工具箱,Agentic Workflow是动态编排系统。未来是人机协作,人类从操作工变成决策者,技术演进是元素融合而非简单取代。
2026-03-19 19:17:28
404
原创 从零开始学AI Agent:2026年大模型核心概念,一篇搞定全收藏
AI Agent是2026年AI生态核心,具备自主决策能力,通过感知、规划、行动、记忆和反思组件实现闭环。A2A协议促进Agent间协作,MCP标准化工具调用,Agent Skills模块化能力提升专业性。这些技术正广泛应用于自动化工作流,大幅降低开发门槛,成为大模型应用的重要发展方向。
2026-03-19 19:16:08
398
原创 从零到一:基于上下文工程的Agent后端架构详解
本文介绍了一个基于上下文工程的Agent后端架构设计,包含四大核心模块:工具模块和管理、上下文管理、LLM模块和Agent执行器。文章详细阐述了各模块的设计思路与实现方法,特别强调了上下文管理在Agent设计中的核心地位,并提供了完整的代码示例和相关仓库链接,帮助开发者构建高效的Agent系统。
2026-03-14 13:14:36
362
原创 大模型Skill开发实战:两步走策略,将模糊需求转化为高质量AI技能
文章探讨了如何将模糊需求转化为高质量AI Skill的实践方法。指出用户需求往往不完善,隐藏着未明说的约束。Claude擅长挖掘隐藏需求,将模糊表述转化为明确约束;Codex则擅长将这些约束转化为符合Skill机制的结构。最佳实践是先使用Claude处理模糊需求,明确约束后再用Codex创建或更新Skill,形成"先显化需求,再固化Skill"的工作流,提高Skill开发的效率和质量。
2026-03-14 13:12:26
461
原创 【收藏必备】企业AI Agent为何频频失败?本体论解决方案让你少走弯路
文章分析了企业AI Agent面临的幻觉、语义不一致等问题,指出现有工程手段只能局部解决。提出本体论作为构建企业"语义层"的解决方案,能统一概念与关系、支撑复杂推理、提升可解释性。文章详细介绍了本体构建的6块核心积木及本体与知识图谱的区别,强调本体是"语义与规则"的框架。
2026-03-14 13:11:31
410
原创 【值得收藏】AI Agent框架实战:从理论到代码实现,揭示AI的核心能力
文章详解AI Agent框架理论实践,阐述ReAct等模式,对比主流框架。核心观点是AI Agent本质在上下文工程,提出Agent Loop设计模式,通过极简代码实现包含LLM Call、Tools Call和上下文工程的框架。强调代码是AI核心能力,展示如何通过简单工具实现强大功能。
2026-03-14 13:10:33
628
原创 【必收藏】AI Agent落地的关键角色:前线部署工程师(FDE)完全指南
文章探讨了AI Agent从试点到生产过程中前线部署工程师(FDE)的关键作用,分析其如何将客户特定复杂性转化为产品资产。FDE通过消化客户世界、建立深度直觉,将反馈输入产品路线图,成为公司保真度最高的产品信号源。文章详细介绍了FDE模型的规模化方法、生命周期三阶段,以及如何通过FDE痛苦转化为产品能力的速度来判断是构建平台公司还是服务公司,强调了FDE在AI Agent落地中的核心价值。
2026-03-09 21:24:59
543
原创 收藏必备:大模型后训练完全指南 - 从微调到多模态集成的五大核心范式详解
本文系统介绍了大语言模型后训练的五大核心范式:微调提升任务准确性,对齐确保伦理一致性,推理增强多步逻辑能力,高效优化资源利用,以及集成与适应扩展多模态能力。从预训练与后训练的区别到各种具体技术方法,包括RLHF、DPO、知识蒸馏等,全面展示了如何优化大模型以适应特定场景需求,提升模型性能和实用性。
2026-03-09 21:23:44
372
原创 为什么你的RAG系统效果不佳?11个组合策略助你准确率从60%提升到94%
本文详细解析了11种先进RAG策略,通过组合应用将系统准确率从60%提升至94%。文章涵盖上下文感知分块、重排序、查询扩展等关键技术,并提供三种实用组合方案:生产就绪堆栈、高准确率堆栈和领域专家堆栈。作者提供了从基础到高级的实施路线图,帮助开发者避免常见错误,构建高效、准确的生产级RAG系统。这些策略适用于客户支持、医疗、法律等多个领域,可显著提升系统性能和用户体验。
2026-03-09 21:22:37
377
原创 收藏级干货:拆解AI Agent核心能力,助你成为Agent流程架构师
本文通过"学霸成长"比喻和旅行规划案例,深入解析了AI Agent从Chatbot进化的本质。Agent能力的质变源于设计的"认知流程"而非模型智力提升,体现在三重价值:用结构为思考建立脚手架,用迭代为记忆打造压缩算法,用交互为模型连接现实世界。文章从控制论和信息论角度阐释了Agent有效性的科学基础,并指出开发者角色正从"提示词工程师"转变为"Agent流程架构师",未来需关注性能工程和高级认知架构的构建。
2026-03-03 19:23:52
401
原创 【收藏必备】大模型Agent开发实战全攻略:从零构建会思考能执行的智能体
本文深入解析AI Agent开发架构与实践,详细介绍规划、记忆、工具调度等核心模块实现,分享基于function call和MCP协议的Agent搭建方法及多Agent协作系统设计。作者结合两年实战经验,提供构建"会思考、能执行"智能体的完整技术路径与架构认知,是开发者入门Agent开发的必学指南。
2026-03-03 19:22:15
442
原创 智能问数Agent架构深度解析:从Dataset到Semantic Layer,程序员必看收藏指南
文章分析了智能问数Agent的两种设计路线:基于Dataset的传统BI增强方案和基于Semantic Layer的指标中心化方案。前者强调快速落地与改造成本,后者注重统一语义资产与长期治理能力。前者适合数据建设早期/中期企业,后者适用于数据治理成熟期/规模化阶段。文章提出可采用渐进式演进策略,先以Dataset架构起步,逐步向语义层架构演进,两种模式可在并行存在中自然过渡。
2026-03-03 19:20:42
424
原创 【程序员必学】RAG系统性能提升秘诀:文本分块技术全解析
本文详细介绍了文本分块作为RAG系统核心技术的关键作用,包括降低检索噪声、减少AI幻觉和缓解上下文丢失。文章系统阐述了五种主流分块策略(固定大小、语义、滑动窗口、反向和Agentic分块),并指导开发者如何根据内容结构、查询类型等因素选择合适方案。最后探讨了分块在企业级应用中的挑战与解决方案,强调分块是RAG系统成败的结构基石,直接影响检索精度和系统性能。
2026-02-26 13:31:16
281
原创 3微秒启动,6.5KB内存:Agno框架让AI智能体开发性能飙升
Agno是一款高性能多智能体系统运行时,以极速(启动3μs,内存6.5KB)、安全和开箱即用为特点。它超越LangGraph等框架,自带FastAPI应用模板和Web控制平面,实现数据主权,极简API让复杂任务仅需10行代码。短短数月GitHub Star突破36.1k+,成为企业级AI应用新宠。
2026-02-26 13:29:34
433
原创 收藏级干货:彻底搞懂MCP、RAG、Agent:AI技术的黄金三角,从小白到专家只需这一篇!
文章介绍了AI领域三大热门概念:MCP(统一接口的"万能转换器")、RAG(解决AI幻觉的"知识大脑")和Agent(主动干活的"智能助理")。这三者形成"黄金三角",MCP负责连接各种工具和知识源,RAG提供准确的知识支持,Agent则主动理解和执行任务。它们的组合正在让AI进化为真正的"智能助手",未来可能渗透到生活各个角落,掌握这些概念有助于跟上AI时代步伐。
2026-02-26 13:27:51
411
原创 从零掌握卷积神经网络(CNN):小白必学的图像处理核心算法
卷积神经网络(CNN)是专为处理网格结构数据的深度学习模型,通过局部感受野、权值共享和下采样提取层级特征。其基本结构包括卷积层、激活函数、池化层和全连接层。相比传统全连接网络,CNN显著减少参数量,保留空间结构信息,广泛应用于图像识别、目标检测等领域。文章提供了PyTorch实现的手写数字识别案例,展示了CNN的实际应用。
2026-02-26 13:26:35
589
原创 【干货收藏】LLM-RL训练框架深度剖析:四大主流框架架构设计与实战选型指南
本文深度剖析了LLM-RL训练的挑战与架构演变,系统解构了TRL、OpenRLHF、verl、LLaMA Factory四大主流开源框架的架构设计、关键特性及适用场景。通过横向评测,从性能、易用性和硬件需求三个维度提供选型建议,帮助开发者根据自身需求选择合适的框架,并展望了LLM-RL训练框架的未来发展趋势。
2026-02-24 18:43:31
796
原创 大模型开发必备:Langchain框架全面解析
文章介绍了Langchain这一大模型代理框架,详细阐述了其核心组件包括agent、tools、memory、model、messages和middleware。文章提供了环境准备指南,包括Python环境配置、模型选择和API设置,并通过一个实例演示了如何创建和调用agent。最后介绍了Langsmith部署方法,帮助开发者可视化整个执行流程。该框架通过整合各大模型厂商接口,为开发者提供了便捷的大模型应用开发工具。
2026-02-23 20:23:11
1054
原创 【建议收藏】大模型的“寒窗苦读“与“应用实践“:训练与推理详解
文章解析了大模型的训练与推理两大核心过程。训练包括预训练(自监督学习海量数据掌握基础能力)和后训练(微调与RLHF教会模型遵循指令)。推理则是实际应用阶段,包含输入处理和迭代生成。训练是一次性高成本投入,创造模型能力;推理是持续交互环节,使用模型能力。两者共同构成大模型完整工作流程。
2026-02-23 20:22:04
848
原创 收藏必备!Agent Skills让AI告别“短期失忆症“,实现能力复用新范式
Agent Skills是Anthropic推出的创新技术,解决了AI智能体的"短期失忆症"问题。它将复杂任务流程固化为可复用的"技能组件",通过三层渐进式加载机制和标准化文件结构,使AI能长期保存和使用知识,无需每次对话重新解释。这一技术不仅提高了AI工作效率,还重塑了AI开发生态,让"能力复用"成为新常态,是AI时代核心竞争力的重要组成部分。
2026-02-23 20:20:35
693
原创 带你破局AI Agent:MCP与A2A定义安全新边界
为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单,这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张,也让人才供需矛盾愈发突出。
2026-02-19 14:12:10
893
原创 【AI大模型】10分析带你彻底搞懂大模型 - Agent(智能体)
本文介绍了基于大语言模型(LLM)的AI Agent技术及其应用。LLM Agent由规划、记忆、工具和行动四大模块组成,能够模拟人类思维过程完成复杂任务。重点探讨了LLM Agent与检索增强生成(RAG)技术的结合,展示了如何构建财报分析Agent系统,包括需求分析、架构设计、数据获取、知识检索等关键环节。文章还指出AI人才需求激增的市场现状,并提供了大模型学习资源包,包含视频教程、技术文档、面试题解等资料,旨在帮助读者快速掌握AI大模型技术。
2026-02-19 14:10:26
611
原创 大模型记忆机制深度解析:它是如何记住你的?
本文探讨了LLM记忆系统的核心机制与实践路径。记忆系统本质上围绕"抽取"和"检索"两大模块展开:抽取层负责从对话、日志等多源输入中提炼有价值信息,通过语义压缩形成长期记忆;检索层则根据当前上下文动态召回相关记忆。关键发现包括:1)对话文本是最优记忆输入源;2)记忆需要支持动态更新与遗忘机制;3)存储形态决定系统能力边界;4)检索是迭代优化的过程。目前业界正通过不同方式(如ChatGPT的用户记忆、Claude的显式技能记录等)探索记忆系统的产品化路径,其终极目标是形成
2026-02-19 14:09:06
701
原创 万字解析:归一化!从Transformer归一化到主流大模型归一化的演变!
摘要 本文系统介绍了归一化(Normalization)在深度学习中的作用和常见类型。归一化通过将数据限制在固定范围内,解决数据可比性问题,提高模型训练效率和稳定性。主要作用包括:消除量纲差异、加速梯度下降收敛、缓解梯度消失问题以及减少内部协变量偏移(ICS)。常见的归一化方法分为线性(Min-max、Z-score、Mean)和非线性(对数、反正切、小数定标)两类,各自适用于不同数据分布场景。文章特别指出,在Transformer等现代神经网络架构中,归一化技术对模型训练至关重要,尽管其实现方式相对简单,
2026-02-19 14:07:39
528
原创 2026全网最详细的AI大模型学习路线!AI大模型应用开发终极学习路线图!
本文提供2026年AI大模型应用开发的系统化学习路线,分为七个阶段:大模型基础、RAG架构、LangChain应用、模型微调、Agent开发、边缘部署和多模态技术。路线涵盖提示词工程、向量数据库、微调方法、Agent框架等核心内容,配有实战项目和代码示例。适合从入门到进阶的学习者,帮助开发者全面掌握AI大模型应用开发技能,提升职场竞争力。
2026-02-19 14:06:12
870
原创 2026校招残酷真相:两个同班程序员,一个死磕传统开发,一个入门大模型,毕业起薪可能差3倍!
摘要: 随着AI大模型技术爆发,高科技企业成为AI人才招聘主力,2026届校招中近60%企业将AI岗位列为核心需求。大模型相关岗位薪资领跑行业,算法工程师月薪中位数超2.4万元。政策加持下,AI人才缺口预计2030年达400万,覆盖算法研发、应用落地等多元方向。零基础者可系统学习大模型技术,资料包含教程、路线图、面试真题等资源,助力抓住职业风口。 (字数:150字)
2026-02-19 14:03:34
1015
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅