- 博客(1866)
- 收藏
- 关注
原创 程序员转型大模型开发:推荐方向、原因及学习路线,非常详细收藏我这一篇就够了!
程序员转行到大模型开发领域,可以根据个人兴趣和职业规划选择不同的方向。以下是几个推荐的方向、推荐原因以及学习路线:
2025-11-03 15:35:59
1504
原创 大模型RAG技术入门:从传统到多模态、Agent、GraphRAG全解析【收藏必学】
文章介绍了四种主流RAG技术:传统RAG(检索-拼接-生成)、多模态RAG(支持文本、图像、视频等多数据类型)、Agentic RAG(引入智能体实现多轮自主检索)和GraphRAG(结合知识图谱增强推理能力)。文章强调根据业务需求选择合适的RAG方式,未来趋势是多种技术融合,RAG作为上下文工程的重要组成部分值得关注。
2026-03-27 14:14:26
421
原创 60个AI大模型核心概念:PM也能听懂的工作场景指南
本文面向AI产品经理,通过60个核心概念的讲解,帮助读者理解大语言模型的基本原理和应用场景。文章强调通过工作场景而非数学公式来理解这些概念,涵盖Prompt工程、RAG、微调、Agent等关键技术,提供实用的决策路径和成本优化建议。作者旨在帮助AI产品经理在技术评审会上听懂、判断和做决策,避免常见陷阱,提高产品效果并降低成本。
2026-03-27 14:13:13
389
原创 【必学】RAG技术入门:程序员必知的检索增强生成完整指南
RAG(检索增强生成)是结合信息检索与生成式大模型的AI框架,解决大模型知识更新滞后、幻觉问题、安全风险及垂直领域知识整合难题。其核心流程包括知识准备(文档解析、分块、向量化、入库)和问答阶段(查询处理、检索、重排序、信息整合、LLM生成),通过外部知识库增强回答准确性和时效性。
2026-03-27 13:46:20
350
原创 【收藏干货】IndexRAG:离线生成桥接事实,实现单次检索的多跳推理
IndexRAG通过两阶段离线索引解决多跳QA困境:先提取原子知识单元(AKUs)和实体,再针对桥接实体生成跨文档桥接事实。在线推理仅需单次检索和LLM调用,配合平衡上下文选择机制。实验显示,相比Naive RAG平均F1提升4.6分,推理延迟仅0.30秒,实现了"一次构建,多次高效查询"的范式转移,兼顾性能与效率。
2026-03-27 13:22:34
19
原创 收藏必备:AI Agent完全解析:2026年AI生态核心技术与开发实践
文章介绍AI Agent作为2026年AI生态核心概念,包括其基本架构(感知、规划、行动、记忆、反思),A2A协议实现Agent间协作,MCP标准化工具调用,以及Agent Skills能力模块化。这些技术共同构成AI Agent开发基础设施,使AI系统能像人类员工处理复杂任务,并通过标准化协议实现安全高效协作。
2026-03-27 13:21:27
293
原创 收藏!大模型Token计费完全指南:从零理解计费逻辑,帮你省下60倍成本
本文详细解析大模型中的Token概念、计费机制及模型选型策略。作为文本处理的最小单位,Token直接影响使用成本。文章揭示了不同模型Token单价可达60倍差距,介绍了上下文窗口限制、输入输出计费差异,以及Prompt Caching等省钱技巧。通过对比主流模型性能和价格,帮助开发者根据场景需求做出最优选型,实现成本与效能的最佳平衡。
2026-03-24 10:29:36
449
原创 AI Agent框架理论与实践:从理论到极简实现,小白程序员入门指南
文章系统介绍了AI Agent框架理论基础,对比分析主流框架,提出上下文工程是Agent智能核心,并提供极简Agent框架的完整实现,涵盖LLM调用、工具调用和上下文管理三大要素,帮助开发者快速构建智能Agent应用。
2026-03-24 10:28:23
539
原创 AI开发必知:Agent、Workflow和MCP详解!
文章解析了AI三大核心概念:Agent(自主决策的AI程序)、Workflow(固定流程自动化工具)和MCP(AI调用外部能力的标准化协议)。三者互补而非替代:MCP提供基础设施连接,Workflow负责流程编排,Agent实现智能决策。文章详细解释了各自特点、区别、适用场景及组合应用方式,并提供实用选型建议和资源。
2026-03-24 10:27:18
341
原创 大模型RAG系统构建指南:5个关键层次解决生产环境痛点,建议收藏
文章详解了RAG系统从Demo到生产的5个进阶层次:基础实现、智能分块、混合搜索、reranking排序和生产级处理。强调构建可用RAG系统需逐步解决各层次问题,从基础开始,记录系统故障点并针对性升级,确保在检索失败时能安全响应而非胡编信息。
2026-03-24 10:17:35
387
原创 【干货】大模型RAG技术实战指南:从原理到代码实现(建议收藏)
文章介绍大模型面临的幻觉、时效性和数据安全三大问题,提出RAG作为解决方案。RAG通过检索外部知识库增强模型能力,降低幻觉问题,提供最新权威信息,保障数据安全。文章详细解释RAG架构,并通过LangChain代码示例展示从文档加载、分割、向量化到检索生成的完整流程。最后对比RAG与微调的区别,指出二者可互补使用,并提供学习大模型的四个阶段路径。
2026-03-19 18:52:10
307
原创 技术干货:一文掌握大模型技术栈:14个核心概念全面解析(建议收藏)
本文系统梳理了AI大模型领域的14个核心概念,从基础架构(Transformer、Token、嵌入模型)到训练优化(预训练、微调、对齐),再到前沿应用(RAG、Agent、协议等)。文章深入浅出地解释了大模型实现"智能涌现"的原理,以及如何解决幻觉、对齐等关键挑战,帮助读者建立全面认知框架,为深入研究与应用大模型奠定基础。
2026-03-19 18:43:08
289
原创 收藏这篇!大模型Skill开发实战:从模糊需求到高质量AI工具的转化艺术
本文探讨了如何将模糊需求转化为高质量AI Skill。作者对比了Claude和Codex两种工具的特点:Claude擅长挖掘模糊需求中的隐藏约束,Codex擅长将清晰需求转化为符合Skill机制的结构化产物。文章提出实践路径:先用Claude处理模糊需求,明确真实意图和约束;再用Codex的skill-creator创建或更新Skill,确保结构合理、按需加载。这种串联方式能有效解决需求模糊时Skill创建的难题,提高开发效率和质量。
2026-03-19 18:41:18
300
原创 【收藏必备】大模型入门指南:36个AI关键术语全面解析,从小白到程序员必学知识
文章从7个维度系统介绍了AI领域的36个关键术语,包括底层逻辑、模型架构、核心技术、训练方法、应用技巧、评估标准和伦理安全等。通过通俗易懂的比喻和解释,帮助读者理解AI基础知识,如AGI、Transformer、RAG等概念,以及如何提示词工程、微调模型等实用技能,为学习大模型奠定基础。
2026-03-19 18:40:21
332
原创 大模型RAG完全指南:Embedding模型选型、向量搜索与重排序核心技术详解,程序员必看收藏!
本文系统解析RAG技术栈三大核心组件:Embedding模型、检索策略与Rerank重排序。对比分析了主流Embedding模型性能与选型策略,整理20个高频面试问题及12种调优策略,深入解析向量搜索与Rerank的本质区别,强调"粗排+精排"两阶段架构的设计智慧,为构建高性能RAG系统提供全面指导。
2026-03-19 18:39:17
462
原创 收藏级干货:大模型训练VS推理:从零构建到应用部署的完整指南
模型训练与推理是AI大模型的核心环节。训练包括预训练(自监督学习海量数据)和后训练(微调与RLHF),是一次性高投入的"创造能力"过程;推理则是模型实际应用阶段,通过处理输入和迭代生成回答,是持续的"使用能力"体现。两者相辅相成,共同构成大模型从学习到应用的完整生命周期。
2026-03-19 18:38:02
317
原创 生产级AI助手开发全攻略:LangGraph+FastAPI+Streamlit实现指南
文章介绍了一个基于LangGraph、FastAPI和Streamlit构建的生产级AI助手概念验证项目。该项目采用分层架构,实现了状态管理、多轮对话、意图识别等功能,遵循生产环境设计原则。文章详细讲解了项目结构、环境搭建、代码实现和运行方法,同时提供了性能优化、安全注意事项和扩展建议,帮助开发者构建可扩展、可靠的AI应用。
2026-03-14 11:51:00
48
原创 下一代AI智能体架构革命:从多模态处理到自我反思,全面解析大模型未来发展之路
文章解析下一代AI智能体架构的五大变革:输入层多模态处理与实时集成、智能体间协同编排、战略级规划与自我反思能力、统一数据存储与知识图谱、多渠道自适应输出。这些架构变化将使AI智能体本质不同,同时强调安全可控、伦理合规和人机协作,实现更智能可靠的AI系统。
2026-03-14 11:49:46
134
原创 PruneRAG:解决RAG系统证据遗忘与效率问题的创新框架
PruneRAG框架通过自适应节点扩展、置信度引导剪枝和细粒度检索三大机制,解决传统RAG系统的证据遗忘和效率问题。该框架采用树状推理结构,根据置信度决定查询分解策略,实验显示其证据遗忘率降低20.8%,推理速度提升4.9倍,在多个多跳问答数据集上表现优异,为高效检索增强生成提供了创新解决方案。
2026-03-14 11:48:21
135
原创 【值得收藏】大模型调用全解析:一文掌握Transformers底层实现细节
本文详细解析了大模型调用的底层实现流程,包括tokenizer与模型加载、对话模板应用、文本编码、自回归生成及解码输出。同时介绍了大模型的训练过程,解释模型如何从随机参数具备对话能力。从工程实现到原理分析,全面剖析了大模型调用的完整链路。
2026-03-14 11:46:46
164
原创 智能体(Agent)开发全攻略:从基础概念到主流框架对比
章全面介绍了智能体(Agent)的核心概念、架构设计与实现方法,以及主流框架的对比分析。内容涵盖智能体基础工作原理、与传统工作流的区别、模型参数调优方法、核心架构(ReAct、Plan-and-Solve、Reflection)的实现,以及AutoGen、AgentScope、CAMEL、LangGraph等主流框架特点与应用场景。文章还介绍了低代码开发平台和本地部署工具,为开发者提供了构建智能体系统的完整指南。
2026-03-14 11:45:16
311
原创 一文搞懂大模型:从Transformer到智能体,无技术门槛也能学会
本文详解大模型知识体系,对比通用大模型与垂直领域模型的差异,解析Transformer底层架构原理,介绍垂直模型构建方法与成本分析,探讨智能体作为最终产品形态的发展趋势。以通俗易懂的语言,为全行业读者提供零门槛的大模型全链路知识,帮助理解AI从技术底层到行业应用的完整路径。
2026-03-14 11:43:12
360
原创 大模型技术详解:深度解析LLM、GPT、BERT与Transformer架构
大语言模型(LLM)是基于深度学习的超大规模神经网络,能理解、生成自然语言并执行复杂任务。其核心架构是Transformer,通过自注意力机制捕捉上下文关系。LLM训练包括预训练和微调两个阶段。GPT基于Transformer的解码器,擅长文本生成;BERT基于编码器,侧重语言理解。Token是文本处理的基本单位。预训练成本高昂,但开源模型和微调技术降低了应用门槛,使大模型在特定领域应用成为可能。
2026-03-14 11:42:11
295
原创 收藏!一文掌握ReAct Agent:从传统编程到智能体的跃迁之路
本文详细介绍了ReAct Agent的核心原理与实现方式。ReAct(Reasoning+Acting)是一种让AI一边思考一边行动的智能体工作模式,通过"观察-思考-行动"的循环处理复杂任务。文章阐述了ReAct Agent的关键要素:历史上下文、环境信息、语言模型、工具调用和观察结果,并通过实例和伪代码展示了其实现流程。相比传统编程,ReAct Agent能更灵活应对复杂、不确定的任务,是构建AI智能体的重要技术路径。
2026-03-14 11:40:52
443
原创 大模型应用开发黄金法则:越简单越可靠,收藏这篇少走弯路
文章阐述大模型应用开发应遵循简单原则,因模型本身存在不稳定性和幻觉问题,复杂流程会增加出错风险。建议在关键环节采用workflow工作流机制保证稳定性,非关键环节使用模型提高效率。能简单解决的问题不采用复杂技术,如用RAG而非Agent。系统不稳定环节越多,最终偏差越大,简单设计是降低风险的关键。
2026-03-14 11:39:47
352
原创 告别AI术语混乱:一文搞懂Prompt、Agent、Skill、MCP和Claude Code的关系
本文通过公司实习生的比喻,系统解析了AI领域的五大核心概念:Prompt(指令输入)、Agent(自主执行)、Skill(标准化流程)、MCP(工具连接协议)和Claude Code(集成产品)。这些概念构成从"与AI对话"到"让AI自主工作"的完整体系,各自扮演不同角色:Prompt明确目标,Agent规划执行,Skill提供方法,MCP连接外部,Claude Code是现成解决方案。理解它们的层级关系和适用场景,能帮助开发者根据需求选择合适工具,避免被新术语困扰。
2026-03-14 11:38:42
418
原创 【值得收藏】企业级大模型RAG架构设计:从数据摄入到智能体协调的完整指南
本文详细介绍了一个六层架构的企业级智能体RAG系统,涵盖数据摄入、AI计算、智能体流水线、工具沙箱、基础设施即代码和部署评估。通过Ray、vLLM和Kubernetes等技术实现高吞吐量文档处理、并行推理和智能自动扩展,支持向量数据库和知识图谱检索,并提供完整的企业级部署方案和性能优化策略。
2026-03-09 21:20:07
385
原创 【收藏】LangGraph工作流深度解析:5种编排模式+子图架构,轻松构建稳定可控的AI系统
文章介绍了构建智能系统的Workflow模式,详细讲解了5种编排模式:提示词链式调用、并行化、路由、编排者-工作者和评估者-优化者,并通过代码示例展示了如何使用LangGraph实现评估者-优化者模式。文章还介绍了子图(Subgraphs)机制,用于模块化复杂系统,解决代码维护难题。掌握这些技术可以构建既具备创造力又安全可控的智能体。
2026-03-09 21:12:37
400
原创 AI时代架构师必读:从写代码到管Agent的转型指南(建议收藏)
本文探讨了AI时代工程师角色的根本转变,从传统的"写代码"到"管Agent"。文章强调AI原生工程师需掌握分配智能、管理语境和系统设计三大能力,并提出了构建"Agent友好代码库"的四大支柱:测试契约、文档一致性、统一设计模式和风格检查。同时警告了Agent可能快速放大错误的风险,建议逐步搭建多Agent工作流而非一蹴而就。作者认为,在这个转型期,灵活性和实验精神将成为工程师最被低估的资产。
2026-03-09 21:11:35
345
原创 【干货收藏】Skill Graphs:解锁大模型深度认知能力的新范式
Skill Graphs是一种结构化知识组织方式,通过将知识分解为多个互相链接的小文件形成网络,使AI Agent能够主动导航知识结构,只提取当前场景所需内容,实现真正的领域理解。这超越了传统单一功能的Skills,为Agent提供深度认知能力,是"被动执行"到"主动理解"的关键转变。文章提供了构建方法和应用场景,帮助开发者解锁大模型Agent的真正潜力。
2026-03-03 19:09:19
452
原创 【值得收藏】多智能体架构选型逻辑:四种主流方案对比与实战应用
本文深入探讨了多智能体架构的选型逻辑,分析了单Agent向多智能体架构转变的必要性,并详细对比了四种主流架构:子智能体、技能、交接和路由器。文章从上下文管理、分布式开发等角度,结合不同场景需求,提供了架构选择的实用指南和性能矩阵,帮助开发者根据具体业务场景做出最适合的架构决策。
2026-03-03 19:08:19
385
原创 程序员必看!Claude Agent Skills实战指南:构建可复用、可组合的AI能力模块(建议收藏)
Agent Skills是大模型应用开发的新范式,采用基于文件系统的开放标准,解决了传统Prompt开发中的Context Window瓶颈。它通过三级渐进式加载机制(元数据、指令、资源)优化上下文管理,实现了可移植、可组合的模块化技能库。Skills与MCP、Tools、Subagents协同工作,Skill Creator工具可帮助开发者高效创建技能。这种架构使AI开发重心从"调教模型"转向"构建标准化技能库",实现了通用推理能力与严谨执行逻辑的结合。
2026-03-03 19:06:47
584
原创 收藏必备:深度解析Transformer多头注意力机制,让LLM不再神秘
本文详细解析了Transformer架构中的自注意力机制和多头注意力机制。首先介绍了自注意力如何通过Q、K、V矩阵计算注意力分数,使模型能够捕捉序列中元素间的关联。然后解释了多头注意力如何将输入特征拆分为多个子空间,并行处理不同维度的语义信息,最后通过拼接和投影融合结果。这种设计使模型能够同时关注文本的语法、属性和位置等多方面特征,是Transformer和大语言模型的核心技术。
2026-02-27 18:04:56
404
原创 大模型落地新思路:Agent与Workflow构建智能业务系统
本文介绍了智能体(Agent)与工作流(Workflow)的区别及Agentic系统的构建方法。工作流强调预编排的标准化流程,而Agent具备自主决策能力。文章详细阐述了增强型LLM、提示词链接、路由、并行、编排工作者、评估者-优化者及自主智能体等多种工作流搭建方式及其适用场景,并对比分析了N8N、Dify和Coze三大开源框架的特点,为开发者提供了构建高效Agentic系统的实用指南。
2026-02-27 18:03:58
389
原创 收藏必备!Agent Tools全栈开发指南,解决碎片化、复杂化、黑盒化痛点
文章系统阐述了Agent Tools的开发方法与痛点解决方案,包括类型安全、LLM友好接口设计、自我修复能力等六大开发原则;针对工具碎片化、复杂化、黑盒化问题,提出通过AgentKit Gateway实现存量应用智能化、MCP工具治理及身份管理;通过零售和金融行业案例展示了工具化智能的实践价值,核心是将企业复杂业务能力通过工具化封装,实现业务能力AI化转型,构建智能化时代的企业竞争力。
2026-02-27 18:02:24
388
原创 【收藏必备】智能体式RAG完全指南:提升大模型应用能力的核心技术
智能体式RAG通过引入AI智能体实现自主决策和动态工作流,超越了传统RAG的静态检索局限。文章详细介绍了从朴素RAG到智能体式RAG的演进历程,分析了单智能体、多智能体、层次化等多种架构,探讨了其在解决上下文整合、多步推理等挑战上的优势。最后通过实际教程展示了构建智能体式RAG系统的步骤,为开发者提供了提升大模型应用能力的技术路径。
2026-02-26 13:11:25
376
原创 为什么一定要做Agent?| 从定义到优势,全面解析AI智能体的价值与未来,值得收藏!
文章深入探讨Agent智能体的核心价值:降低开发门槛,让非专业开发者也能创建应用;简化流程复杂度,大模型如"胶水"连接各模块;支持多样化交互;实现多Agent协同完成任务。尽管存在响应速度慢、幻觉等挑战,但技术创新正在持续优化这些问题。Agent作为解放生产力的工具,是提升效率的关键,值得企业长期投入。
2026-02-26 13:09:58
347
原创 【必收藏】LangChain生态全景图:从入门到生产级应用开发指南
本文详解LangChain生态三大核心:LangChain负责能力构建,提供大模型调用和工具集成;LangGraph负责流程编排,处理复杂工作流和状态管理;LangSmith负责观测优化,监控和评估应用性能。三者形成构建-编排-监控的完整闭环,是AI应用从Demo走向生产级的必经路径,也是大模型开发者的必备知识体系。
2026-02-26 13:08:48
295
原创 【收藏必备】大模型核心技术揭秘:Transformer架构从入门到精通
文章详细解析了大模型核心技术Transformer架构,从基础组件(Embedding层、Transformer Block、输出层)到关键机制(Attention、KV Cache),再到前沿技术(MLA、MoE)进行了系统讲解。文中提供了Polo Club可视化工具和DeepSeek-V3论文等宝贵资源,帮助读者深入理解大模型工作原理,适合初学者和进阶研究者。
2026-02-24 18:33:16
591
原创 AI架构必看:Agent、Workflow、RAG还是Skill?万字详解大模型系统设计避坑指南
本文通过AI内容产品实战案例,剖析了AI系统架构设计的常见误区与解决方案。作者指出AI产品应定位为"放大器"而非"创造者",构建Model+RAG+Skill+Workflow的最小完备内核,通过慢变量系统对抗模型快变量迭代。未来架构重心将从能力增强转向安全控制,强调在模型能力不断提升的同时,架构的可解释性、数据主权和成本控制价值将永存,为AI产品设计提供系统性思维。
2026-02-24 18:32:22
749
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅