- 博客(922)
- 收藏
- 关注
原创 小白程序员必看!3大方法教你赋予LLM规划能力,收藏学起来!
本文介绍了赋予LLM规划能力的3种核心方法:CoT(思维链)、ToT(思维树)和GoT(思维图)。CoT通过在prompt中添加指令,使LLM逐步输出推理过程;ToT让LLM同时探索多条路径并选择最优路径;GoT则利用图结构实现推理节点的复用和合并。文章详细解析了每种方法的原理、用法及工程选型,强调CoT简单易行,ToT成本较高但效果更优,GoT目前主要应用于学术研究。对于希望提升LLM规划能力的开发者,本文提供了宝贵的参考和指导。
2026-05-05 21:46:21
352
原创 从软件工程师到AI专家:告别转型误区,收藏这份高效学习指南
本文针对软件工程师转向AI工程师的常见认知误区进行了梳理,指出从头学习复杂AI底层技术和仅靠调用API两种错误观念。文章明确了转向AI的核心技能,包括理解LLM工作原理、掌握prompt工程、应用RAG技术及了解代理设计模式,并强调了评估技能的重要性。同时,提出从简单AI功能实践入手,逐步提升技能,持续学习成为领域专家的高效学习路径,旨在帮助工程师理清转型思路,少走弯路。---
2026-05-05 21:43:39
373
原创 大模型技术知识库:从入门到实战,小白也能学会的精简高效学习版(含收藏)
本文提供了一套从大模型基础原理到实战应用的学习路线,包括LLM与Transformer的核心机制、Prompt工程技巧、RAG技术构建私有知识库、AI Agent自主任务执行、大模型微调以及部署工程化。内容涵盖关键技术生态、学习顺序建议及实战案例,旨在帮助读者系统掌握大模型技术,实现从入门到高效应用的目标。
2026-05-05 21:41:12
314
原创 18道核心面试题助你轻松掌握AI Agent技术,小白也能学会收藏备用!
本文通过18道精选面试题,深入浅出地介绍了AI Agent的基础概念、技术原理、进阶应用、实战场景及工程实践。内容涵盖AI Agent的定义、架构、ReAct框架、任务规划、记忆系统设计、工具选择、多Agent协作模式、效果评估、开发陷阱、客服、数据分析、研发等应用场景,以及Token消耗控制、安全性保障、幻觉问题处理、主流开发框架、自主学习能力培养和未来发展趋势等关键知识点,旨在帮助读者全面了解AI Agent技术,快速提升实践能力。
2026-04-29 13:46:06
422
原创 收藏必备!小白程序员轻松入门大模型应用开发(内含排查技巧)
本文针对RAG系统上线后检索不到文档的问题,提供了一套从源头到后处理的排查方法。首先检查文档是否正确入库、切分质量和元数据完整性;其次验证语义表示是否一致,包括模型选择、能力匹配和表述差异处理;接着逐个放宽检索参数,如相似度阈值、TopK和索引参数;最后关注排序和后处理环节,如Rerank和上下文截断。文章强调利用Trace系统记录全链路数据,通过对比实验和人工标注测试集进行验证,帮助开发者精准定位问题,提升大模型应用开发能力。
2026-04-29 11:57:52
352
原创 【干货】构建高效RAG系统必学:5种分块技术全解析,收藏这篇就够了
分块(Chunking)是构建高效RAG(检索增强生成)系统的核心。从固定分块、递归分块到语义分块、结构化分块和延迟分块,每种方法都在优化上下文理解和准确性上扮演了关键角色。这些技术能大幅提升检索质量,减少“幻觉”(hallucination),并充分发挥你的RAG pipeline的潜力。
2026-04-25 13:57:41
763
原创 10个Agent设计高频问题解决(附代码),小白也能轻松入门大模型并收藏学习!
本文精选了10个关于Agent设计的高频且挑战性问题,涵盖了RAG流水线性能评估、幻觉现象减少、大模型微调、多语言检索系统设计、法律领域大模型输出评估、欺诈检测模型调试、智能客服Agent延迟优化、生物医学检索系统相关性提高、客户支持Agent持续改进以及多模态大模型图文标题生成效果评估等关键方面。每个问题均提供了详细的解决方案和示例代码,旨在帮助读者深入理解大模型应用架构的精髓。文章强调Agent设计需要技术选型、架构思维与业务场景的深度融合,并鼓励读者掌握这些问题的解决思路与方法,以应对复杂的大模型生态
2026-04-25 11:58:37
289
原创 大模型训练秘籍:小白也能学会的AI核心技术(收藏版)
本文全面解析了大语言模型(LLM)的训练技术,从预训练到微调,再到最新的强化学习训练方法。文章详细介绍了LLM训练的基本流程、核心知识点、训练方案分析、挑战难点以及模型训练的本质。通过学习本文,读者将深入理解LLM的训练原理,掌握最新的训练范式,如DeepSeek-R1所采用的推理导向训练。此外,文章还探讨了模型训练的数学本质、优化理论视角、学习机制深度解析以及涌现现象等关键概念,帮助读者全面把握LLM训练的精髓。对于想要入门大模型训练的读者来说,本文提供了宝贵的理论知识和实践指导。
2026-04-25 11:49:56
548
原创 收藏!小白/程序员必看:如何在大模型「战国」时代开发AI Agent?LangGraph vs LlamaIndex 深度解析
文章探讨了开发AI Agent的不同工程体系,当前AI领域正处于类似「战国」的混战时代,从业者需审慎选择。重点对比了LangGraph和LlamaIndex两个主流框架,分析了它们对Agent的抽象方式、Multi-Agent系统搭建方法,以及在状态管理、接口易用性、并发和streaming支持等关键特性上的差异。LangGraph采用基于「图」的编排框架,强调动态编排;LlamaIndex则区分Agent和Workflow,但底层趋向统一的事件驱动编排。文章指出,两者底层逻辑虽殊途同归,但实现细节差异大,
2026-04-25 11:44:20
313
原创 AI大模型风口已至:从入门到精通,收藏这份完整学习路线图!
只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发【附赠一节免费的直播讲座,技术大佬带你学习大模型的相关知识、学习思路、就业前景以及怎么结合当前的工作发展方向等,欢迎大家~】
2026-04-25 11:38:34
283
原创 收藏!小白程序员必看:轻松掌握RAG,让AI秒变“外接大脑”!
本文深入浅出地介绍了RAG技术,即通过检索增强生成,为AI提供“外接大脑”,解决其私有数据缺失和知识过时两大痛点。文章通过生动的类比,阐述了RAG的工作原理及其在知识库问答、客服机器人、代码助手、研究助手等场景中的应用。RAG不仅大幅减少AI幻觉,还能实时更新知识、访问私有数据,且成本远低于模型微调。对于想要构建高效AI应用的开发者,RAG是不可或缺的关键技术。
2026-04-20 13:50:47
474
原创 新手必看:揭秘AI大模型幻觉,收藏这篇轻松入门!
大模型幻觉是指AI生成内容时出现与事实相悖、虚构或误导性信息的现象。其成因包括模型本质是预测而非理解、训练数据存在偏差、对齐副作用与过拟合,以及无法回头修改错误等。缓解方案包括让模型引用来源、明确告诉它不知道、使用检索增强生成等。对于关键信息,仍需人工复核。
2026-04-20 13:48:20
456
原创 Agent大模型落地指南:从技术现状到解决方案,小白也能学会收藏!
本文深入探讨了Agent大模型在ToB场景中的应用现状与挑战,分析了标准ReAct和Plan-and-Execute ReAct两种主流决策框架的优缺点,并结合实际项目案例,提出了针对业务需求复杂性和技术局限性的优化方案。内容涵盖了快慢思考模型结合、泛化工具定义、多智能体协作、异常处理等关键技术点,为Agent大模型的落地应用提供了实用参考。
2026-04-20 13:45:36
356
原创 5种AI Agent设计模式深度解析:收藏这份生产级Agent架构选型指南
随着大模型在Agent领域的应用,单点提示词已无法满足复杂业务流需求。本文深入剖析ReAct、Plan-and-Execute等5种核心设计模式,提供基于业务场景的架构选型思路。通过分析各模式的运行机制、能力边界及工程代价,帮助开发者以最小必要复杂度构建生产级Agent。文章强调透明度与性能损耗的权衡、规划与执行的分离、工具调用的脆弱性、自我反思的效率问题以及跨域协作的复杂性,最终提出架构设计应遵循"最小必要复杂度"原则,避免技术堆砌,实现精准高效的AI应用。
2026-04-20 11:58:12
344
原创 一文吃透大模型基础:小白也能秒懂,收藏这份AI进阶指南!
本文用通俗易懂的语言介绍了大语言模型(LLMs)的基础知识,解释了其核心概念、工作原理以及与传统AI的区别。文章还分享了3个必记知识点,帮助读者避开认知误区,并列举了职场办公、学习提升和日常生活等多个实用的应用场景。最后,文章鼓励读者拥抱AI时代,通过学习大模型基础知识,提升自身竞争力。
2026-04-20 11:53:56
387
原创 小白必看!大模型Token计费全解析(附省钱技巧&收藏版选购指南)
本文以餐厅按食材重量计费类比大模型Token计费机制,解释了Token作为语言积木的构成、对话的本质、上下文窗口限制及主流模型的计费策略。文章强调理解Token计费对成本控制、模型选型和使用体验的重要性,并提供了省钱技巧(如Prompt Caching、Batch API)和模型对比评测资源,帮助读者根据场景选择最优大模型。
2026-04-14 14:41:10
556
原创 收藏!小白程序员轻松入门大模型,手把手教你做自己的Agent
本文为面向普通人的大模型入门课,从运行逻辑到工作流、工具、记忆、测试、多Agent,以及Anthropic和OpenAI两条入门路线进行了全面讲解。文章强调先理解核心循环,再逐步增加复杂度,并提供实用工具设计和评估建议,帮助读者快速上手制作实用的AI Agent。
2026-04-14 14:37:29
520
原创 小白程序员必备:轻松入门大模型Agent,从概念到实战全解析
本文深入浅出地介绍了AI领域中的Agent概念,将其定义为一种系统设计范式,而非单纯的模型能力。Agent的核心在于让模型在明确目标、工具、状态记忆和安全边界内,替用户完成完整工作流。文章探讨了Agent与传统自动化、RPA、聊天机器人的区别,并详细解析了Agent的系统架构,包括交互层、Orchestrator、模型层、工具层等关键组成部分。此外,还介绍了ReAct、Toolformer等关键技术和典型工作流模式,最后提出了Agent在生产级应用中的工程实践建议。
2026-04-14 14:29:14
610
原创 小白也能懂!用RAG让大模型精准回答业务问题(收藏版)
本文从工程角度解析了RAG(检索增强生成)系统如何解决大模型在业务问题回答上的精度问题。核心流程包括:通过Embedding将文本向量化,在向量数据库中进行相似度检索(TopK召回),再利用Reranker进行重排序以选出最相关内容,最后由LLM基于检索结果生成答案。关键点在于Embedding负责找相似,Reranker负责选最优,LLM负责生成答案。本文还探讨了RAG系统效果不佳的原因及工程实践要点,强调数据组织与检索对AI应用效果的重要性。
2026-04-13 13:56:10
447
原创 零基础入门Agent:你的数字分身已上线,职场小白也能轻松收藏掌握高效技能!
本文深入浅出地介绍了AI Agent与普通AI的区别,强调Agent的自主思考、工具串联及跨软件协作能力。文章列举了Agent在职场办公、内容创作、电商、数据分析和个人效率等多个场景下的实战应用和案例,并指出了最适合及不适合使用Agent的场景。此外,还提供了零基础用户上手Agent的详细步骤和模板,包括选工具、定角色目标、给工具记忆和写指令测试等,最后介绍了多Agent协作的高阶玩法和避坑指南,旨在帮助读者利用Agent提升工作效率,将重复工作交给机器,从而专注于更有创造性的任务。
2026-04-13 13:53:42
487
原创 掌握类人记忆,解锁AI大模型潜力:小白也能轻松收藏学习!
本文深入探讨了AI智能体的“健忘症”问题,并提出了一种类人记忆系统架构,通过三个层次(情节记忆、实体关系、社群摘要)帮助AI建立长期连贯记忆。这种架构能提升上下文感知、个性化服务、推理能力和检索效率,推动AI从工具向伙伴转变。对于想抓住AI大模型风口的学习者,本文提供了宝贵的学习路径和资源分享,助力入门与进阶。
2026-04-11 11:43:01
387
原创 收藏!小白程序员必看:轻松入门AI大模型,打造你的智能体(附学习资料)
AI智能体由“大脑”(大模型)和“手”(执行器)组成,分为五个发展阶段。当前多数智能体处于Level 1和Level 2,实现Level 3以上难度较大。文章探讨了智能体在RAG效果、功能单一、安全等方面的痛点及解决方案,并建议学习大模型技术以抓住风口。
2026-04-11 11:39:54
313
原创 小白程序员必备!轻松掌握AI大模型,收藏这份学习指南!
AI Agent(人工智能代理)的核心在于其主动决策能力,能理解模糊目标、规划执行路径、调用外部资源,并在动态环境中自主修正行为,最终独立达成复杂任务。文章详细阐述了AI Agent的定义、技术构成、核心特征、技术闭环、应用场景等,并通过具象化案例解析了财务报销审核Agent的工作流程。此外,文章还探讨了AI Agent的架构设计、关键技术、评估方法以及未来发展趋势,为读者提供了全面而深入的学习指南。
2026-04-11 11:37:02
379
原创 收藏!小白程序员必看:轻松入门大模型RAG,解锁私有知识库的奥秘
本文介绍了大模型RAG(检索增强生成)技术,旨在解决大模型因训练数据限制而无法处理非公开或最新信息的问题。RAG通过连接外部知识库,使大模型能基于私有或特定信息生成答案,适用于企业私有知识库等场景。文章详细阐述了RAG的核心原理和构建步骤,包括文档收集切割、向量转换存储、文档过滤检索以及查询增强关联。此外,还探讨了学习大模型的意义和必要性,强调在AI时代掌握相关技术的重要性,并提供了学习资源和路径图,助力读者入门和深入学习。
2026-04-11 11:33:47
306
原创 收藏!小白程序员必看:大模型分块策略实战指南,轻松提升RAG效果
本文介绍了大模型分块策略的选择问题,通过分析四项基准测试结果,指出递归字符拆分策略在多数情况下优于语义分块,并强调评估分块策略时应关注端到端答案准确率而非仅看检索指标。文章还讨论了不同文档类型应选择的分块策略,以及实践中容易踩的坑,并提供了LangChain和LlamaIndex的实操代码示例。
2026-04-10 21:13:18
404
原创 小白程序员必备!收藏这份大模型学习指南,从入门到实战轻松掌握!
本文深入浅出地介绍了大模型的核心概念、技术原理及应用实践。从Transformer架构、预训练语言模型到LLM评测体系,详细解析了LLM的关键技术,如RAG检索增强生成和Agent智能体。文章强调通过标准化数据集和评测榜单科学评估模型性能,并提供了Tiny-RAG和Tiny-Agent的实战实现方案,帮助读者全面理解并应用大模型技术,把握AI发展风口。
2026-04-10 21:10:52
346
原创 大模型知识库构建:收藏这份小白程序员必备指南,轻松掌握智能Agent检索技术!
本文介绍了为大型语言模型配备外部知识库的重要性,重点讲解了检索增强生成(RAG)的原理及其优缺点。文章提出智能Agent方案,让模型主动理解文档结构,生成关键词指令进行本地文档搜索,实现更精准的答案生成。同时探讨了“不检索”的极端设想及其可行性边界,并详细阐述了结合GPT-5 API调用和Agent工具使用编排的技术实现细节。最终强调新旧方案的融合与混合增强知识库架构的重要性,展望智能Agent知识库成为新范式的未来趋势。
2026-04-10 21:08:10
406
原创 收藏!小白也能看懂的大模型训练秘籍,2026年AI风口必看!
本文深入浅出地介绍了AI大模型的核心概念与训练过程,从通用AI系统架构到模型训练的基本原理,详细解析了神经网络如何通过前向传播、反向传播和权重调整等过程实现高效学习。文章还探讨了保证模型训练质量的关键因素,如数据清洗与增强,以及普通人如何抓住AI大模型的风口,提供了从零入门到进阶的实战学习路线图。强调高质量数据、深度学习对于提升模型泛化能力的重要性,并鼓励技术从业者积极投身AI大模型领域学习。
2026-04-10 21:03:18
680
原创 新手程序员必看:收藏这份Agent规划指南,让你的AI智能体真正“聪明”起来!
本文主要探讨了如何规划一个AI智能体(Agent),使其更智能、更实用。文章从定义Agent应用场景、梳理业务流程、分析用户痛点、明确功能和开发需求等方面进行了详细阐述,并以短视频文案改写Agent为例,具体说明了如何将这些规划步骤付诸实践。通过清晰的规划,可以有效避免开发过程中的弯路,让Agent真正解决用户的实际问题。此外,文章还强调了学习AI大模型技术的重要性,并提供了相关学习资料,鼓励读者抓住AI大模型的风口。
2026-04-08 14:12:08
532
原创 小白程序员必看:收藏这份Agent入门指南,轻松玩转大模型开发!
本文详细解析了Agent的概念,并以国内主流开发平台Coze为例,通过实操演示了如何基于大模型开发简单的智能体。从工作流编排到节点设置,逐步引导读者搭建一个能检索总结网络新闻信息的智能体。文章旨在帮助初学者理解智能体开发的基本思路,掌握大模型开发的核心技能,抓住AI大模型发展风口。
2026-04-08 14:06:51
553
原创 小白程序员必看:AI大模型从“一无所知”到“对外提供服务”的三步进阶之路
本文以学生备考、上考场到毕业就业为比喻,深入浅出地介绍了AI大模型从无到有的三个核心阶段:训练、推理和部署。训练阶段如同学生的“寒窗苦读”,通过海量数据和算法让模型掌握规律;推理阶段是模型“上场考试”,对未知数据进行预测和判断;部署阶段则像是把“学霸”安排到合适的工作岗位,让用户真正使用AI能力。文章详细解析了每个阶段的关键要素和特点,并探讨了常见的部署方式,旨在帮助小白和程序员理解大模型的发展过程,抓住AI大模型的风口。
2026-04-08 14:04:00
341
原创 大模型核心技术解析:从理论到实践的完整指南(值得收藏)
这篇文章记录了作者对大语言模型(LLM)的学习笔记,内容包括LLM的基础概念、预训练与后训练流程、文本生成过程以及Transformer架构详解。文章解释了Tokenization、Embedding、多头注意力机制等关键技术,并介绍了微调、蒸馏、量化等模型优化方法。此外,还涵盖了RAG、MCP、涌现能力和Agent等前沿概念,为理解大语言模型提供了全面的技术视角。---
2026-04-07 21:55:09
332
原创 大模型技术对比:RAG与微调,从原理到选择,程序员必看指南(建议收藏)
文章详细对比了大模型的两大技术:RAG(外挂知识库,模型不变)和微调(改造模型参数,内化知识)。从数据特性、定制需求、幻觉控制等8个维度分析如何选择,RAG适合动态数据和高准确性场景,微调适合静态数据和定制能力。建议中小项目优先考虑RAG,成本低见效快。
2026-04-07 21:51:54
496
原创 【必收藏】AI Agent设计核心三要素:LLM+Tools+Prompt框架,从小白到设计师的进阶指南
文章提出AI Agent设计的"三元素框架":LLM(推理能力)、Tools(上下文管理)和Prompt(目标设定)。LLM作为大脑需谨慎选型,关注性价比;Tools分为Plan类(保持方向)、文件操作类(卸载上下文)和Sub-Agent(隔离上下文);Prompt需目标化并积累为可复用的Skill。三者协同作用,通过快反馈循环和经验积累,帮助开发者从"会用"升级到"会设计"Agent系统,是少走弯路的关键。
2026-04-07 21:49:15
390
原创 掌握 Agent 技术核心:Skill 设计与封装,节省 60%+ Token,小白也能学会大模型开发(收藏)
本文深入解析 Agent 中 Skill 的设计逻辑、加载机制与能力边界,对比 Skill 与 Tool 的核心差异,并重点讲解如何通过 Skill 封装节省 Token 消耗。提供 Python + Agent 框架的真实代码示例,适用于多智能体系统、AI Coding 及类似 Cursor/Devin 产品的开发人员。
2026-04-03 11:15:44
861
原创 收藏!小白程序员必看:轻松掌握Agent Skills,解锁大模型落地新能力
本文详细介绍了AI Agent专业能力说明书——Agent Skills,如何解决传统AI应用中的痛点,如Prompt零散不可复用、Agent能力难以沉淀、工具调用杂乱等。Agent Skills通过标准化能力描述与执行框架,实现AI能力的封装、复用、迭代和工程化,有效提升AI智能体的执行效率和质量稳定性。文章还探讨了Agent Skills的技术结构、落地价值、实战场景、局限与未来趋势,强调其在AI能力竞争和企业数字化转型中的核心地位。
2026-04-03 11:13:01
511
原创 AI术语大扫盲:小白程序员必备的2026高频概念清单(建议收藏!)
本文用最简短句解释AI术语,按场景分类,覆盖2026年高频概念,帮助快速建立统一认知。内容涉及基础概念(Token、Prompt等)、模型与训练(LLM、Transformer等)、检索与知识(RAG、Embedding等)、智能体与工具(Agent、MCP等)、推理与性能(CoT、Batching等)、安全与合规、评测与指标。建议收藏本文,通过“是什么/有什么用/何时用”三步判断新名词,避免被术语绑架。
2026-04-03 11:10:45
782
原创 收藏 | 从0到1:小白程序员轻松入门大模型全栈技术专家学习路径
本文提供了一个从入门到精通的大模型全栈技术专家学习路径,分为五个阶段:认知破冰与地基搭建,单点深度拆解,融合与打通,架构与创新,以及综合素养。内容涵盖AI 2.0时代的技术范式、开发环境与基础工具链、高质量数据集、知识库(RAG)、大模型架构、智能体(Agent)等核心概念和实践操作。此外,还涉及企业级应用架构设计、性能与成本优化、多模态与结构化数据、高级系统架构、前沿探索等高级主题,旨在帮助读者逐步掌握大模型技术,并具备解决实际问题的能力。
2026-04-01 16:30:26
928
原创 收藏!小白程序员必看:轻松入门大模型三大核心概念(API/MCP/Skill)
本文介绍了大模型开发中至关重要的三个概念:API、MCP和Skill。API是通用技术,用于程序间通信;MCP是AI专属连接方式,标准化的接口连接AI应用与外部系统;Skill则是给AI的阅读说明书,结构化操作指南。三者并非替代关系,而是技术拼图的三个层次。理解这三者的分工与协作,将帮助开发者更有效地构建和优化AI应用,提升开发效率与集成一致性。
2026-04-01 16:27:17
577
原创 RAG入门指南:收藏版,小白程序员快速掌握大模型检索增强技术
RAG(检索增强生成)技术通过结合外部知识库来弥补大语言模型的知识局限,解决其“幻觉”和知识滞后问题。文章首先介绍了RAG的基本原理,包括数据准备和检索生成两个阶段,并阐述了其优势,如准确性高、实时性强、成本低和隐私保护等。接着,文章深入探讨了RAG的各种优化策略,涵盖预检索(摘要索引、父子索引、假设性问题索引和元数据索引)、检索(Enrich完善问题、多路召回、问题分解和混合检索)和后检索(RRF重排序、长上下文重排和上下文压缩过滤)等阶段。此外,文章还介绍了T-RAG、CRAG、Self-RAG、Gra
2026-03-30 11:40:39
518
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅