- 博客(978)
- 收藏
- 关注
原创 从Prompt到Harness:大模型工程化的三代范式演进与实践
生成式AI发展至今,大模型的基础推理能力早已实现跨越式突破,行业的核心矛盾也已从“模型够不够聪明”,转变为“如何让大模型的能力稳定、可控、合规地落地到真实生产场景”。从最初的对话机器人,到如今的企业级业务自动化、AI智能体规模化落地,行业用三年时间完成了三次认知升级,逐步形成了三套层层递进、互为补充的工程化范式:**Prompt Engineering(提示词工程)、Context Engineering(上下文工程)、Harness Engineering(驾驭工程,国内权威译法,也译作管控工程)**。
2026-03-18 21:25:12
1909
原创 Qwen3.5-397B+Milvus+ColQwen2,如何做基于PDF的多模态RAG知识库
架构层面,Qwen3.5的亮点主要在MoE和线性注意力。其中,前者已经是近两年的大模型标准解法,而后者线性注意力也已经被国内kimi、minimax(上一代模型采用线性注意力,最新一代模型又换回了传统注意力)在内一众领先模型玩家所接受。
2026-03-18 21:24:41
524
原创 收藏!2026年大模型必看:从“堆参数”到“智能密度”,端侧AI即将爆发
文章指出AI行业正从单纯堆参数转向“智能密度”。清华团队发现同等智能所需参数每3.5个月减半。文章还介绍了递归语言模型和混合架构。预测2026年端侧智能将爆发,AI将实现自我改进,云边协同成为主流。
2026-03-17 21:29:23
407
原创 2026年9大热门大模型深度解析:从GPT-5.4到DeepSeek,小白必看
本文深度盘点截至2026年初的9大热门大模型,涵盖OpenAI GPT-5.4、DeepSeek、Qwen、Claude等。文章详细解析了各模型在长上下文、开源生态及企业级应用上的独特优势,助你快速把握大模型行业前沿动态。大模型的技术迭代一天一个样,在本文我们重点介绍了我们截止2026年初,目前在行业内引起关注的 9 个 LLM,每个模型都具有独特的功能和专业优势,在自然语言处理、代码合成、少样本学习或可扩展性等领域表现出色。
2026-03-17 21:28:44
711
原创 小白程序员快速入门ReAct Agent核心原理与工程实践
本文深入浅出解析ReAct Agent的核心原理与工程价值,帮助开发者从“写流程”到“造智能体”实现关键跃迁。文章详细介绍了Function Calling、MCP和Skills的区别与竞合关系,阐述了它们在AI Agent工具调用中的核心作用与实现机制。通过Lynxe框架的实践案例,揭示了如何用文字定义指令、脚本和资源,以及如何解决工具集成与任务流程定义的难题。文章最后总结了三者定位,并提出了Lynxe Func-Agent的思路与优势,为AI Agent的实际应用提供了可行路径。
2026-03-09 21:25:41
394
原创 APO 1.5.0智能体工作流:告别重复运维,一键复用经验,小白也能轻松上手!立即收藏掌握高效运维新技能!
APO 1.5.0版本推出的智能体工作流功能,允许用户将日常运维操作和故障排查经验转化为标准化流程,实现一键复用,大幅提升效率。无需改造现有监控系统,即可开箱即用。文章介绍了如何快速上手内置的告警有效性分析和告警根因分析工作流,以及如何创建和调整专属工作流。同时,详细解析了工作流平台中的数据查询、异常检测和数据验证图表等关键节点,展示了如何利用这些工具实现自动化治理,从救火式响应进阶为自动化运维。
2026-03-09 21:25:09
370
原创 CICD与Jenkins流水线:小白程序员轻松入门自动化软件开发
本文深入浅出地介绍了CICD的核心概念、发展历程以及Jenkins流水线的原理、功能和实际应用。无论您是软件开发领域的初学者,还是希望进一步优化团队开发流程的专业人士,本文都旨在为您提供全面且实用的知识与案例,帮助您更好地理解和运用CICD与Jenkins流水线,开启高效软件交付之旅。
2026-02-27 19:21:20
338
原创 AI-Compass LLM推理框架+部署生态:整合顶级加速框架,轻松掌握大模型部署
AI-Compass是一个全面、实用、前沿的AI技术学习和实践生态,包含六大核心模块,为不同层次的学习者和开发者提供系统化学习路径。本文聚焦LLM推理框架+部署生态,整合vLLM、SGLang、LMDeploy等顶级加速框架,涵盖本地到云端全场景部署,助力小白和程序员快速掌握大模型部署技能。
2026-02-27 19:20:20
714
原创 Claude Skills完全指南:提升大模型能力的提示词架构
文章解析Claude Agent Skills的第一性原理:基于提示词的动态上下文注入与元工具架构。Skills不是可执行代码,而是通过Markdown指令"植入"模型,实现动态加载专家能力。文章从本质、架构、机制和流程四个维度剖析,揭示如何通过"元工具"将静态知识转化为动态上下文,实现功能无限扩展和按需加载。
2026-02-09 19:28:40
908
原创 从0到1构建智能体:19条实战经验,助你避开99%的坑
文章总结了智能体(Agent)开发的19条实战经验,强调业务需求与实际实现间的差异。核心观点包括:明确业务真正需要的是"稳定"而非完全自动化;知识库构建需注重可检索性而非规模;意图识别需考虑测试与真实诉求区别;必须建立完善的评测体系和badcase库;确定性逻辑应优先于完全依赖模型;交付时需提供完整运营机制而非仅功能。这些经验对构建稳定、可控、实用的智能体系统具有重要指导价值。
2026-02-09 19:27:50
659
原创 Agent Skills 爆火!一文搞懂它与 MCP、Prompt 的区别
本文解析了爆火的 Agent Skills 概念,它是一种将 SOP 转化为 Agent 可复用能力的开放标准。文章对比指出:Prompt 侧重即时交互,MCP 侧重系统连接,而 Skills 则是真正可复用的“经验层”。文中介绍了 Skills 的工作原理,推荐了相关资源库,并以 Cursor 为例演示了如何安装使用 Skills 来提升开发效率。
2026-02-07 11:14:34
770
原创 AI Agent记忆系统全面解析:形态-功能-动力学三维框架详解
这篇由多所顶尖大学联合出品的综述,采用"形态-功能-动力学"三维框架分析200+最新论文,提出Token-level/Parametric/Latent三大记忆形态。内容涵盖记忆形式化定义、三大功能、生命周期管理及7大前沿方向,提供30个评测集和20+开源框架,是AI Agent记忆系统学习的必读资料。
2026-02-07 11:13:41
376
原创 LLM Agent Skills完全指南 - 从零构建生产级智能体系统
文章详细介绍了LLM Agent Skills这一基于提示词的元工具架构,通过封装专业知识和结构化行为指南,解决领域特有知识问题。采用渐进式信息披露机制优化Token使用,提升Agent在长周期任务中的鲁棒性和一致性。文章对比Skills与Tools的区别,探讨安全挑战与防御机制,并提供从设计到开发的最佳实践,为构建生产级Agent系统提供架构指导。
2026-02-06 10:44:01
707
原创 AI时代大语言模型深度解析:2025年主流模型对比与应用指南
本文全面解析2025年大语言模型发展现状,对比OpenAI GPT-5、Google Gemini、Meta Llama 3等主流模型的特点与应用场景,介绍科研辅助、金融分析等实际落地案例,探讨模型面临的幻觉问题、安全挑战等技术难点,指出大语言模型正从"辅助工具"向"协作伙伴"演进,为开发者和企业提供实用参考。
2026-02-06 10:42:29
462
原创 AI智能体构建指南:2大核心架构+9种设计模式,让小白也能快速上手
文章介绍智能体持久性记忆系统的实现,通过双路记忆堆栈(情节记忆+语义记忆)解决智能体"健忘"问题。使用向量数据库存储对话历史,图数据库管理实体关系,实现"交互-检索-生成-编码"闭环。提供完整代码实现,使智能体能够记住用户信息并提供深度个性化交互,从"工具"转变为"伴侣"。
2026-01-31 18:32:29
638
原创 大模型智能体开发:如何实现“记住用户“的双路记忆系统
文章介绍智能体持久性记忆系统的实现,通过双路记忆堆栈(情节记忆+语义记忆)解决智能体"健忘"问题。使用向量数据库存储对话历史,图数据库管理实体关系,实现"交互-检索-生成-编码"闭环。提供完整代码实现,使智能体能够记住用户信息并提供深度个性化交互,从"工具"转变为"伴侣"。
2026-01-31 18:31:51
668
原创 大模型RAG系统优化:检索与生成之间的隐藏管道
文章揭示RAG系统成败关键在于检索与生成之间的"增强层"。大模型对上下文位置有偏好效应,检索后处理管道(过滤、重排序、去重)至关重要,提示词架构影响模型表现。优化建议包括混合搜索、控制文本块数量、利用位置效应等,这些细节常被忽视,却是提升性能的关键。
2026-01-30 19:22:16
557
原创 LangChain上下文工程实战:解决AI智能体“翻车“问题的关键技术
文章介绍了LangChain框架中通过上下文工程构建可靠AI智能体的方法。从数据来源(运行时上下文、状态、存储)和生命周期(瞬态上下文和持久上下文)两个维度详细解释了上下文的类型和使用方法。瞬态上下文通过中间件动态调整模型调用参数,持久上下文通过工具回写和生命周期管理实现智能体的连续性学习。最后提供了实用的避坑指南,帮助开发者构建生产级的上下文管道。
2026-01-30 19:21:04
959
原创 大模型技术栈全景图:从Transformer到Agent,小白也能掌握的AI核心知识
本文系统梳理了AI大模型的14个核心概念,从基础架构(Transformer)、数据处理(Token与Embedding)到训练优化(预训练、微调、对齐),再到前沿应用(RAG、Agent、MCP等)。文章深入浅出地解释了大模型如何实现"智能涌现",并探讨了幻觉问题、提示工程等关键技术挑战。这些相互关联的概念共同构成了现代大模型技术全景图,是理解AI发展路径的重要基石,适合小白和程序员系统学习大模型知识。
2026-01-29 19:05:15
753
原创 Qwen3-VL多模态模型架构与工程落地实战详解
文章详解了Qwen3-VL-Embedding和Reranker多模态检索模型,采用双塔架构和交叉编码器,通过三阶段训练构建。模型支持MRL套娃表示(可降维节省成本)和QAT量化(减少显存)。文章针对文字为主和视觉密集型业务提供架构选择建议,在MMEB-v2榜单取得SOTA成绩。
2026-01-29 19:04:27
598
原创 大模型技术发展全景图:从符号主义到多模态智能的演进之路
本文系统梳理了大模型技术发展历程,从1950年代符号主义开始,经历统计机器学习、神经网络革命,到2017年Transformer架构突破,再到预训练范式确立、规模扩张与多模态融合。文章详细分析了架构演进逻辑、训练技术突破及能力跃迁轨迹,并探讨当前挑战与未来方向,为理解大模型技术发展提供了全面视角。
2026-01-28 18:09:56
913
原创 大模型应用工程师完整学习路线:从提示词到Agent系统,助你入门高薪领域
文章介绍了大模型应用工程师的高薪前景(年包50w+)和2025年Agent元年的行业趋势,推荐了一条包含提示词工程、检索增强生成(RAG)、模型微调、模型部署及人工智能系统与项目的五大核心模块学习路线。这条从基础到实战的完整路径,帮助开发者掌握大模型技术并实现项目落地,是入门大模型领域的绝佳选择。
2026-01-28 18:09:00
949
原创 AI Agent实战指南:从“只会说“到“会做事“,程序员效率革命必读
文章讲述了AI从ChatGPT式的"嘴炮王"到AI Agent"行动派"的革命性转变。AI Agent具备记忆、工具使用和目标驱动三大能力,通过API和MCP协议实现与外部系统交互,Agent to Agent协作模型实现专业分工。2025年将是AI Agent和MCP的落地年,这不仅是技术升级,更是工作方式的革命,掌握这些工具将获得显著效率优势。
2026-01-22 18:56:56
733
原创 11个顶级AI Agent与大模型开源项目,从入门到精通全攻略
文章介绍了11个AI Agent与大模型领域的开源项目,包括AutoGPT、Dify、LangChain、MetaGPT等。这些项目各具特色:AutoGPT是AI Agent领域的鼻祖;Dify是应用开发平台;LangChain是构建Agent的事实标准;MetaGPT和ChatDev专注于多智能体协作;Flowise提供低代码环境;CrewAI主打角色扮演;SuperAGI适合企业级应用;Letta解决AI长期记忆问题。这些工具覆盖了从入门到高级的AI开发需求,是学习和实践大模型应用的重要资源。
2026-01-22 18:56:14
904
原创 大模型推理优化技术详解:从Roofline到系统优化,一篇全掌握
本文系统介绍了大模型推理优化技术,从Roofline模型评估硬件效率,到模型层面的剪枝、量化和蒸馏等优化方法,再到快速解码算法如早停、MOE和并行解码,最后详述系统层面的算子融合、批处理优化和内存管理等技术。这些方法共同构成了提升大模型推理效率的综合技术体系,为不同场景下的模型部署提供了全方位优化思路。
2026-01-14 16:24:07
797
原创 AI Agent从Demo到生产:企业级基础设施平台AgentRun全攻略
阿里云函数计算AgentRun是面向企业级AI Agent的一站式基础设施平台,旨在解决从原型到产品的"生产化鸿沟"。它提供极致弹性扩展、企业级安全沙箱、模型工具统一治理、全链路可观测及生态开放支持,帮助企业跨越环境复杂运维难、依赖不稳定成本高、运行过程黑盒化三大痛点,让开发者专注业务创新,实现AI Agent从Demo到生产的平滑过渡。
2026-01-14 16:23:18
1177
原创 大模型微调技术演进指南:从LoRA到MoR1E完全解析
本文系统解析大模型微调技术演进,重点介绍LoRA、MoLoRA和MoR1E三种参数高效微调方法,通过低秩分解、专家混合等技术解决全参数微调的资源消耗与灾难性遗忘问题。文章从技术原理、优缺点、适用场景到实际应用案例全方位分析,提供技术选型指南和最佳实践,帮助开发者用最小参数变化激发最大模型潜能。
2026-01-13 15:30:28
274
原创 万字长文:大模型微调完全指南——14种主流方法详解与实践技巧
这篇文章全面介绍了大型语言模型的14种主流微调技术,包括全微调、部分微调、BitFit、Prefix Tuning、Prompt Tuning、P-Tuning、Adapter、LoRA等。文章详细分析了每种方法的原理、优缺点和适用场景,帮助开发者在资源有限的情况下选择最适合的微调策略。通过对比不同技术在参数效率、计算成本和性能表现上的差异,为开发者提供了从入门到实践的完整指南,使大模型微调变得更加高效和经济。
2026-01-13 15:29:45
347
原创 从大模型到多模态,图文混排Agent彻底起飞~
上周是智谱的多模态开源周,从GLM 4.6v到Autoglm...看到官方的博客,第一眼比较吸引我的,不是模型本身,是他们给的一个使用场景 - **图文并排**。上传一份 PDF 论文,它能生成一篇图文混排的解读文章,而且效果非常好。图片位置精准,上下文衔接自然,完全不像是机械拼接的。过去我们想做图文混排,都是预定义一些图片,让多模态大模型生成描述,再让LLM在写文章时结合图片描述,选择合适的图片url。
2026-01-07 18:12:37
1001
原创 RAG分块完全指南:7种核心策略详解,让你的大模型效果翻倍
随着大模型的不断发展,小参数模型的能力也在逐渐进步,就拿阿里最新开源的qwen3来说,其中有负责多模态的qwen3-vl系列和专为代码优化的qwen3-code系列等,这些不同使用场景中都有开源的小参数模型来方便我们本地部署。
2026-01-07 18:11:09
865
原创 深入浅出RAG:为什么没有搜索就没有真正的检索增强生成
RAG是一种解决大模型知识更新不及时、幻觉和时效性问题的方法论,由检索和增强生成两部分组成。搜索技术作为RAG的核心组件,有多种实现形式,包括字符串匹配、分词技术和语义相似度检索等。大模型生成质量取决于上下文构建方式和检索数据质量,而搜索技术正是保证上下文质量的关键。在处理表结构数据时,可利用大模型语义理解能力生成查询语句或参数。
2025-12-31 18:27:08
1143
原创 AI Agent核心技术:让大模型从“回答问题“到“完成目标“
AI Agent是大模型的"身体"和"神经系统",具备自主决策、持续学习、多模态交互、工具集成和多智能体协作五大特征。其架构包含感知、决策、执行、记忆和反馈优化等模块,可实现目标导向、事件触发、人机协作和多智能体协同四种工作模式。文章全面解析了AI Agent的开发路径,帮助读者构建能理解目标、做出决策、调度工具并持续进化的"数字员工",实现从"告诉机器怎么做"到"告诉机器想要什么"的转变。
2025-12-31 18:26:28
892
原创 用Coze搭建零代码智能客服:职场人必备的AI提效神器
本文详细介绍了如何使用Coze平台零代码搭建智能客服系统,解决职场人士重复回答客户咨询的问题。通过三大步骤:1)构建知识库作为"大脑",导入各类文档和知识;2)设计工作流实现"逻辑",包括问题理解、知识检索、语言优化等节点;3)创建智能体将两者结合,实现7×24小时自动回复。最后介绍了发布部署方式,帮助用户解放双手,提升服务质量与转化率。
2025-12-20 17:45:40
931
原创 大模型行业发展与生态体系全解析,程序员必学收藏
大模型作为人工智能发展的战略核心,正从规模驱动转向结构创新。全球产业格局由垄断转向多极竞争,中国凭借市场规模和应用场景跃居第一梯队。多模态融合与智能体演进成为竞争焦点。CBDG四维生态模型(消费者、企业、设备、政府)解析了中国大模型发展新范式,企业竞争力已从技术单点对决演变为全方位体系化竞争。
2025-12-20 17:44:31
695
原创 大模型RAG实战教程:从零开始构建高效知识库系统
文章详细介绍了使用Dify平台构建RAG系统的完整流程,包括向量嵌入模型配置、文档切片优化策略、检索召回方法(向量检索、全文检索、混合检索)以及提示词兜底技术。通过查询优化和召回测试,提高检索准确性,减少大模型幻觉,最终构建高效的知识库系统。适合想要提升大模型应用效果的开发者学习和实践。
2025-12-05 18:38:17
1199
原创 一文讲透RAG、LangChain与Agent:大模型应用的三驾马车
本文深入解析RAG、LangChain与Agent三大技术的本质区别与协同关系。RAG作为"记忆库"解决大模型知识边界问题;LangChain是开发框架简化应用构建;Agent赋予模型自主决策能力。文章详述各技术落地要点,如RAG的数据切分与检索优化、LangChain的使用技巧与局限、Agent的稳定性挑战,并强调技术选型应基于业务需求,三者协同可构建企业级AI助手,LangChain作为工具箱,RAG为核心功能,Agent为高级应用形态。
2025-12-05 18:37:34
1047
原创 从零掌握LoRA:大模型参数高效微调技术详解
本文详细介绍了LoRA(Low-Rank Adaptation)参数高效微调技术,通过引入小尺寸可学习矩阵A和B来修改大型预训练模型权重W,显著减少内存和计算开销,同时保持与全参数微调相当的性能。文章解释了LoRA的数学原理、参数初始化方法(B初始化为零而A不能的原因),并指出其能将检查点大小减少约10,000倍,训练速度提高25%,且不引入推理延迟,是微调大模型的理想选择。
2025-11-29 11:08:20
1050
原创 大模型微调核心技术:监督微调(SFT)详解与实战指南
本文系统介绍大模型微调技术,重点阐述监督微调(SFT)的概念、数据要求和实现方法。详细对比全参数微调、部分参数微调和参数高效微调(PEFT)的优缺点,深入解析LoRA、Prefix-Tuning等主流PEFT方法的技术原理与应用场景。同时探讨SFT阶段的幻觉问题及其解决方案,为开发者提供大模型微调的实用指导。
2025-11-29 11:03:21
1069
原创 解决Agent多步任务卡壳:从「上下文断裂」到「状态自愈」实战指南
本文解析AI Agent多步任务卡壳的"上下文断裂"问题,提出通过结构化任务状态管理、智能上下文检索、执行监控检查点及状态自愈机制解决。强调将任务状态显性化、结构化并辅以智能上下文管理,可有效避免上下文断裂陷阱,提升Agent的一致性与可恢复性,是Agent工程化的核心竞争力。
2025-11-28 14:31:46
926
原创 传统自动化VS Agentic AI:企业智能升级战略指南与程序员转型路径
本文系统比较了传统规则驱动型自动化与Agentic AI智能自主型自动化的特点、优势与局限。Agentic AI以大型语言模型为核心,具备目标导向、多步骤规划、记忆反思闭环等特征,能处理复杂场景,但存在"黑箱"决策和成本较高问题。二者并非替代关系,而是互补共存:传统自动化适合稳定标准化场景,Agentic AI更适合复杂创新型任务。企业应构建自动化+Agent的混合系统,实现人机协同增效,推动软件工程向更智能方向演进。
2025-11-28 14:29:34
675
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅