自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2167)
  • 收藏
  • 关注

原创 【收藏必备】大模型术语小白指南:一文看懂AI核心概念,从此聊AI不再犯难

本文将AI复杂术语转化为通俗易懂的大白话,解析人工智能、机器学习、深度学习的层级关系,将大语言模型比作"超级文本猜词器",介绍生成式AI作为"全能创意助手"的能力,以及AI Agent作为"自主干活助理"的特点。同时提醒读者了解数据偏见和模型漂移等风险术语,帮助小白和程序员轻松理解AI技术,理性应用大模型工具。

2026-02-28 10:36:29 655

原创 【必学收藏】RAG技术详解:从0到1构建大模型智能问答助手

本文详细讲解了RAG(检索增强生成)技术,解决了纯LLM回答不准确的问题,相当于给大模型配备"随身图书馆"。文章介绍了RAG完整流程:数据分片(5种方法)、索引、召回(向量相似度计算)、重排和生成。特别指出召回阶段成本低但准确率有限,重排阶段通过cross encoder提高精确度。最后预告将指导读者使用RAG搭建医疗领域智能问答助手,帮助读者从理论到实践掌握这一关键技术。

2026-02-27 20:04:49 461

原创 掌握AI Skills:为AI配备现实世界“技能包“的必备指南(建议收藏)

文章介绍了Anthropic的Skills特性,一种让AI具备可执行专业能力的新方法。通过渐进式披露机制,将专业知识封装成可复用技能包,解决上下文成本问题,提高执行确定性,实现团队知识传承。Skills让AI从"知道"转变为"会做",实现从需求到部署的全流程自动化,开创了AI应用新范式。

2026-02-27 20:03:39 380

原创 超全收藏!吴恩达Agent学习指南:从入门到多Agent协作,代码+误差分析全解析

本文是吴恩达Agent课程的精简学习笔记,详细对比了LLM与Agent的区别,介绍了Agent开发流程(基础设定、工具调用),重点讲解了Evals误差评估方法及改进策略,最后阐述了多Agent协作实现方式。文章通过发票处理等实际案例,以通俗易懂的语言为小白提供了从理论到实践的完整Agent学习路径,强调通过实操掌握Agent开发技能。

2026-02-26 10:58:57 425

原创 零基础入门:企业AI Agent开发实战指南(附完整代码)【收藏必看】

文章基于吴恩达AI Agent工程化理念,提出企业落地的五步循环路径:业务痛点识别与流程解构、最小可行Agent构建、评估体系工业化、规模化扩展与体验优化、持续反馈与领域增强。通过详细步骤说明、评估标准和"采购合同风险审查"模拟案例,指导企业从零构建AI Agent,实现高效自动化处理,最终目标是使高度AI使用成为业务常态,人类专注于例外决策与策略优化。

2026-02-26 10:29:06 465

原创 必学收藏 | 大模型不会告诉你RAG的秘密:一文搞懂检索增强生成技术!

本文通俗解释RAG技术如何解决大模型三大短板(不知私有信息、易产生幻觉、垂直领域不专)。RAG通过"先查资料再回答"的方式分为离线数据处理和在线检索匹配两阶段。重点详解离线处理四步骤:收集原材料、文档解析(OCR/转Markdown)、文档清洗和文档分块。强调分块是决定检索效果的关键,需根据场景反复调试优化。

2026-02-26 10:28:24 575

原创 收藏!一文彻底搞懂Transformer中的归一化技术,大厂面试必考

Transformer归一化技术(LayerNorm及其变体)解决深层网络训练不稳定问题,通过统一数据分布避免特征"喧宾夺主"、稳定训练节奏、提高模型泛化能力。大厂采用Pre-LN结构,用RMSNorm等变体优化显存效率,结合业务场景微调。归一化技术从Post-LN演进到Pre-LN再到自适应优化,不断提升大模型训练效率和稳定性。

2026-02-25 10:21:32 583

原创 深度学习搜索Agent架构精讲:从迭代到递归,一篇就够了,值得反复研读

文章介绍了深度搜索Agent的几种主流架构:从基础迭代式到Planner-Only动态拆分,再到双模块评估和递归式设计。详细讨论了停止条件处理、澄清问题机制、检查清单评分等评估方法,以及ROMA递归架构的优势与挑战。作者指出这些架构可根据需求选择,并提供了实用的Prompt模板。

2026-02-25 10:18:05 562

原创 【深度收藏】大模型知识检索系统设计:四大核心模块实现92%准确率

本文详细介绍了大模型检索智能体的设计方案,包含四大核心模块:查询理解(提升准确率>92%)、多步迭代检索(基于语义相似度触发)、联合检索(向量库+知识图谱)和动态知识更新(事件驱动+版本管理)。方案通过技术选型与落地建议,实现高质量、可追溯、实时性的知识支撑,满足Agent系统的高效检索需求。

2026-02-24 09:46:52 584

原创 值得收藏:从RAG到Agent Network:Agentic AI 7层技术栈完整解析

文章系统介绍了Agentic AI的7层技术架构,从基础模型与算力层到可观测性与治理层,强调其不仅是应用形态,更是全新的软件工程范式。文章指出Agent项目易失控的原因在于忽略协议、编排和治理层,企业应从编排与可观测性切入,而非仅关注UI。2025-2026年将是Agentic AI的基础设施之战。---

2026-02-24 09:45:00 1113

原创 大模型智能体完全指南:评估、监控与承包商模型(收藏版)

文章详解智能体评估与监控体系,包括轨迹评估三大维度、多智能体协作评估和承包商模型。通过系统性测量与闭环优化,确保智能体持续有效、高效、合规。评估监控是智能体规模化基石,推动AI从"被动执行"向"主动负责"转变,为高风险场景提供可靠保障。

2026-02-24 09:37:12 632

原创 收藏!从GPT-1到GPT-5,大语言模型的进化之路

本文系统梳理了GPT系列从GPT-1到GPT-5的发展历程。GPT-1开创预训练+微调范式,GPT-2引入零样本学习,GPT-3以1750亿参数实现涌现能力,GPT-4成为多模态大模型,GPT-5则展现出更强的编码能力和更低的幻觉率。各代模型在参数规模、训练方法和应用能力上不断突破,推动大语言模型技术持续发展。

2026-02-24 09:37:02 548

原创 收藏必备!多智能体系统实战指南:从单Agent到团队协作的AI革命

多智能体系统通过多个AI Agent协作,实现复杂任务的并行处理,效率比单Agent提升90%。文章详解了多智能体系统的概念、优势及在软件开发、海报创作等领域的实际应用,介绍了MetaGPT、ChatDev等主流框架。学习多智能体系统是把握AI时代风口的关键技能,文章还提供了从基础理论到实战应用的大模型学习资源,建议收藏学习。

2026-02-23 19:39:04 652

原创 AI大模型学习必看:从提示词到上下文工程的演进与5种编排模式【收藏】

本文阐述了从提示词到提示词工程再到上下文工程的大模型技术演进历程,详解了5种上下文编排模式及其应用场景,探讨了神经网络结构与AI架构的相似性,并提供了大模型学习路径和职业发展建议,帮助技术人抓住AI风口,系统掌握大模型核心技术。

2026-02-23 19:38:55 449

原创 【必学收藏】大模型记忆体:让AI拥有“过目不忘“的超能力,完整指南

文章主要介绍了大模型记忆体的概念、重要性、设计要素及代表性实现方案。记忆体分为参数记忆和非参数记忆,通过记忆写入、管理和读取操作实现信息的长期存储与调用。代表性方案包括Reflexion、MemoryBank、MemGPT等,它们通过不同的机制增强LLM的长期交互能力和个性化服务。记忆机制被视为LLM-Agent区别于原始LLM的标志性组件,是实现通用人工智能的关键基础设施。

2026-02-23 19:38:46 770

原创 大模型三大核心技术:蒸馏、RAG与微调详解 | 程序员必备收藏指南

文章详解大模型三大核心技术:模型蒸馏(适合资源受限场景)、检索增强(RAG)(适合需外部信息更新的应用)和模型微调(适合领域专用需求),对比其概念、优缺点和典型案例。介绍LoRA微调技术和大模型学习资源,为技术选型和学习路径提供指导,帮助读者掌握AI大模型核心技能。

2026-02-23 19:38:37 959

原创 强烈推荐:智能体强化学习:解锁大语言模型自主决策能力的终极指南(含500+研究总结)

这篇综述通过500+研究的系统梳理,清晰地展现了Agentic RL的技术脉络——它不仅是“LLM+RL”的简单结合,更是将LLMs从“文本生成工具”重构为“自主决策智能体”的范式革命。从核心能力上看,规划、工具使用、记忆等模块通过RL实现了“从静态到动态”的跨越;从任务场景上看,搜索、代码、数学推理等领域的落地,证明了Agentic RL解决真实问题的价值;从未来方向上看,可信度、规模化、环境复杂度三大挑战,则指明了通用AI智能体的研发路径。对于研究者而言,这篇综述提供了完整的技术框架与文献索引;

2026-02-23 19:38:30 549

原创 【值得收藏】从零开始学AI Agent:字节扣子平台功能详解,大模型应用开发必备指南

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。

2026-02-21 09:00:00 629

原创 【必收藏】九大LangChain工具调用实战模式:从路由超时到缓存防护,让你的智能体在高并发下稳定运行

本文介绍了九种生产级LangChain工具调用模式,包括严格模式、计划执行、意图路由、并发超时、幂等性、预算控制、防护栏、缓存和可观测性。这些模式解决了大模型智能体在高QPS环境下的稳定性问题,通过结构化输出、工具限制、预算管理和错误处理等技术,确保智能体在生产环境中可靠运行。文章提供了具体实现代码和整合方案,帮助开发者构建专业级AI应用。

2026-02-21 08:30:00 1274

原创 【收藏必看】LangChain vs LangGraph:大模型开发框架选择指南与学习路径

文章对比了LangChain(静态顺序工作流)和LangGraph(动态分支工作流)两大框架及其技术生态,包括RAG检索增强、MCP上下文协议、A2A智能体协作等。同时提供大模型学习路径和资源,帮助开发者掌握AI应用开发技术。

2026-02-20 09:15:00 1275

原创 告别“一次一问一答“:企业级多AI智能体架构实战指南,程序员必收藏

本文详解企业级多AI智能体架构,介绍具有自主性、主动性的AI智能体与传统AI的区别,阐述多智能体系统的五大核心步骤与设计原则。重点解析Langgraph框架下的多智能体架构模式、交接通信机制及人机交互中断控制技术。文章还提供大模型学习路径与资源,帮助开发者掌握AI智能体开发技能,抓住AI大模型时代的技术风口。

2026-02-20 09:00:00 1137

原创 【收藏必备】小白也能学会的大模型Agent开发:从理论到实践全攻略

本文详解大模型Agent技术,涵盖其核心架构、规划模块、工具调用、ReAct框架、记忆机制及死循环解决方案等关键技术点。同时介绍多Agent协作系统设计、Agent与RAG结合及自我进化实现。文章提供系统学习资源,帮助程序员从零入门进阶,掌握AI时代核心技能。

2026-02-19 09:00:00 613

原创 【收藏必看】RAG技术全面解析:从原理到实践,打造专属大模型应用

本文详细解析了RAG技术的核心概念、传统流程及实际应用场景,分享了向量化、重排序等关键技术原理,并探讨了幻觉、上下文长度、多跳问题等实践挑战,为开发者提供了从入门到实战的大模型学习路径,助力打造个性化AI应用。

2026-02-19 08:15:00 1189

原创 【建议收藏】大语言模型(LLM)安全术语全解析:从入门到精通的核心概念指南

本文整理了大语言模型(LLM)安全学习的全链路核心术语表,涵盖数据准备、模型架构与预训练、模型微调、评估与部署等四大阶段,共60个术语详解,包括数据清洗、Transformer、注意力机制、SFT、RLHF等关键概念,并提供术语缩写对照与FAQ,帮助开发者、研究者和AI爱好者快速理解LLM技术核心。

2026-02-18 09:15:00 1381

原创 【2026最全】大模型学习路线图:从理论到部署的完整指南(附资源)

文章系统介绍大模型学习七大核心领域:基础理论、技术架构、训练方法、实践技能、提示工程、工程部署及评估安全。提供从入门到专业四阶段学习路径,强调理论与实践结合。同时分享视频教程、PDF书单、行业报告等丰富资源,帮助读者零基础系统掌握大模型技术,实现从理论到实战的全面提升。

2026-02-18 07:45:00 624

原创 LoRA与QLoRA技术详解 - 大模型微调的内存优化与高效训练指南

只要你真心想学习AI大模型技术,这份精心整理的学习资料我愿意无偿分享给你,但是想学技术去乱搞的人别来找我!在当前这个人工智能高速发展的时代,AI大模型正在深刻改变各行各业。我国对高水平AI人才的需求也日益增长,真正懂技术、能落地的人才依旧紧缺。我也希望通过这份资料,能够帮助更多有志于AI领域的朋友入门并深入学习。真诚无偿分享!!!vx扫描下方二维码即可加上后会一个个给大家发。

2026-02-17 09:45:00 1190

原创 【必学收藏】从Prompt到Context:构建AI智能体的核心演进与实战指南

本部分旨在建立 Prompt Engineering 与 Context Engineering 的基础概念,清晰地界定二者之间的区别与联系。从前者到后者的转变,代表了人工智能应用开发领域一次关键的演进——从业界最初关注的战术性指令构建,转向由可扩展、高可靠性系统需求驱动的战略性架构设计。Prompt Engineering 是与大型语言模型(LLM)交互的基础,其核心在于精心设计输入内容,以引导模型生成期望的输出。这一实践为理解 Context Engineering 的必要性提供了基准。定义。

2026-02-17 08:45:00 1270

原创 大模型RAG技术完全指南:从基础到前沿,收藏级干货助你构建可靠AI应用

本文全面介绍检索增强生成(RAG)技术,从基础概念到前沿应用,详解混合搜索、重排模型、查询转换和自适应检索等关键技术,以及构建高性能RAG系统的工程实践。RAG通过结合LLM的参数化知识与外部知识库,有效减少模型幻觉,提供更准确、可溯源的答案,帮助开发者掌握构建可靠AI应用的核心技能。

2026-02-16 08:45:00 832

原创 超越RAG:本体增强生成(OAG)如何重塑企业决策能力 | 收藏学习

今天,我们一同见证了从 RAG 到 OAG 的飞跃,并深入了解了 Palantir AIP 如何通过一整套强大的数据工具链——从 HyperAuto 的快速集成,到 Data Health 的质量保障,再到 Data as Code 的敏捷开发和 OMA 的安全管控,最终通过 AIP Logic 将这一切赋能给大语言模型,构建出真正能解决企业核心问题的智能应用。

2026-02-16 08:15:00 1313

原创 多模态大模型入门指南 | 程序员必学,值得收藏!

多模态大模型是能同时处理文本、图像、音频、视频等多种信息形式的AI技术,通过编码器、融合机制和解码器实现跨模态理解与生成。它解决了普通大模型在"看图说话"、"多感官协同"和"跨模态生成"场景中的局限,在工业质检、智能教育、自媒体创作等领域有广泛应用。选择多模态模型应关注核心能力匹配度、性能指标、可扩展性和成本部署难度,GPT-4V和华为云盘古是国内外代表模型。

2026-02-15 08:45:00 523

原创 【必学收藏】揭秘大模型的基石:Token是什么以及为何它决定了AI的能力边界

Token是大型语言模型处理文本的基本单位,它决定了模型如何理解语言。不同的分词方法(如BPE、WordPiece、SentencePiece等)将文本分解为不同粒度的Token,通过分配唯一ID和转换为嵌入向量才能被模型处理。分词质量直接影响模型性能,尤其在处理非英语语言、数学问题和拼写错误时。理解Token机制有助于开发者优化提示词、估算API成本,并认识AI能力的边界。

2026-02-15 08:00:00 1530

原创 【必收藏】从零开始学RAG:大模型检索增强生成实战指南,小白也能轻松掌握!

在之前的文章中,我们已经介绍了从经典transformer到最新的模型架构的变化。不过在实际的工作中,其实大部分同学都很少参与模型的训练,或者直接拿开源的框架就可以轻松实现这一过程,对于底层逻辑不求甚解即可。在后面的内容中,我们会逐步去介绍**RAG、Agent构建**等和实际场景落地相关的内容,从**理论到实践以及场景调优**的手段,由浅入深的了解整个落地的过程。本文主要针对RAG,先进行系统性的介绍。

2026-02-14 09:30:00 822

原创 小白也能掌握AI工具箱:轻松入门Agent Skills,提升效率10倍,速收藏!

简单来说,Agent Skills 就像是 AI 的工具箱。你可以把它理解成一个超级智能助手,它不仅能理解你的需求,还能自己选择合适的工具来完成任务。Agent:能自主思考和行动的 AI 智能体Skill:智能体掌握的具体技能或工具能力就像你雇佣了一个全能管家,你说"帮我整理邮件",它就会自动打开邮箱、筛选重要邮件、分类归档。Agent Skills 不是遥不可及的技术,而是每个人都能掌握的实用技能。在这个 AI 时代,学会使用 Agent,就相当于给自己的能力装上了加速器。

2026-02-14 09:00:00 912

原创 建议收藏!揭秘OpenAI o1与DeepSeek-R1:强化学习如何提升大模型推理能力

本文综述了强化学习在提升大型语言模型推理能力方面的最新进展,重点介绍了OpenAI o1和DeepSeek-R1等模型如何通过可验证奖励强化学习实现规划、反思和自我纠正等高级推理能力。文章系统分析了RL for LRMs的基础组件(奖励设计、策略优化和采样策略)、面临的挑战以及未来发展方向,旨在推动RL向更通用、更强大的推理模型发展,最终实现ASI。

2026-02-14 08:00:00 1041

原创 6个Prompt技巧,让你的ChatGPT输出质量瞬间提升,小白也能轻松掌握并收藏!

本文介绍了6种提升大模型输出质量的Prompt技术,包括Few-shot Prompting、Zero-shot Prompting、Chain-of-Thought、Prompt Hierarchy、Role-specific Prompting和Negative Prompting。这些技术通过调整模型的输出分布、明确指令、强制模型进行多步计算、设置权限系统、聚焦能力投影和避免输出失控等问题,帮助用户获得更高质量的输出结果。掌握这些技巧,即使是小白也能轻松提升ChatGPT的输出质量,是值得收藏和学习的

2026-02-14 08:00:00 565

原创 收藏!5分钟搞懂KV Cache,让你的大模型越聊越快!

大模型生成文本速度慢是因为每次生成新词都要重复计算历史词的注意力。KV Cache通过缓存已计算的Key和Value矩阵,将计算量从O(n²)降至O(n),显著提升推理速度,尤其在长文本生成场景下效果显著。但KV Cache会占用额外显存,长文本场景需配合优化策略使用。这项技术是ChatGPT等主流大模型推理框架的标配,让多轮对话、代码生成、文档翻译等应用更加流畅高效。

2026-02-14 06:15:00 597

原创 零基础入门AI大模型:12个月学习计划(收藏版),循序渐进掌握核心技能!

本文为AI大模型零基础学习者量身定制了一份12个月的学习计划,分为四个阶段:第一阶段(0-2个月)打牢数学、编程及机器学习基础;第二阶段(3-5个月)深入学习大模型核心原理、Transformer架构、Prompt工程及常用工具;第三阶段(6-9个月)学习模型微调技术、RAG、应用框架及部署优化;第四阶段(10-12个月)可选择性深入多模态大模型、RLHF等方向,并进行复杂项目实战。计划强调动手实践、理论与实践结合,并建议积极参与社区,保持学习热情。

2026-02-13 18:08:18 586

原创 小白程序员必备:手把手教你用PyTorch构建Transformer大模型(收藏版)

本文详细介绍了如何使用PyTorch从零开始构建完整的Transformer模型。内容涵盖了位置编码、多头注意力、前馈网络、编码器层、解码器层等关键组件的实现,并提供了完整的模型结构和训练示例。文章还讨论了模型的应用场景和性能优化技巧,适合想要学习大模型的小白程序员参考和收藏。

2026-02-13 17:59:09 502

原创 小白程序员必看!收藏这份Agent大模型记忆系统工程化实战指南

本文深入探讨了Agent与大模型记忆系统的核心设计原理,强调其工程化落地需平衡速度、容量与成本。文章提出了分层存储、统一表示、动态调度和容错一致性四大原理,并设计了高速、操作、持久和扩展四层架构,实现高效的多模态记忆管理。同时,文章还介绍了与现有系统的融合及工程化落地的关键步骤,为相关系统设计提供全面参考。

2026-02-13 17:56:06 838

原创 小白程序员轻松入门大模型核心技术——注意力机制

本文用生活化类比(如咖啡厅聊天、图书馆借书、小组讨论、多角度拍照)通俗易懂地解释了AI为何需要以及如何运用注意力机制处理信息。深入剖析了QKV机制、自注意力、缩放点积注意力、多头注意力等核心概念,并介绍了三种注意力类型(自注意力、交叉注意力、因果注意力)及其优势。文章强调注意力机制是现代AI实现智能理解的关键,让模型能像人类一样选择性地关注重要信息,提升性能并增强可解释性。---

2026-02-13 17:52:49 394

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除