- 博客(968)
- 收藏
- 关注
原创 掌握 Prompt Engineering 的系统方法:从“会用”到“有壁垒”的七条实战原则
在 2026 年之后,几乎所有日常工具都会逐渐“对话化”。真正的差距,不在于谁能使用 AI,而在于谁能构建高质量提示词系统。很多人以为自己已经掌握了 Prompt Engineering:做了一个自定义 GPT、搭了一个 Claude Project、写了几个“万能提示词模板”。但现实是——输出依旧普通、风格不稳定、可复用性差。真正的 Prompt Engineering 不是“会写提示词”,而是设计认知架构(Cognitive Architecture)。下面这七条原则,构成了高质
2026-03-18 21:21:49
528
原创 一图看懂LangChain、LangGraph、LangSmith全家桶
很多人学大模型开发,都会听到一个名字:LangChain。但真正开始做项目时,又会被一堆名词:LangChain、LangGraph、LangSmith、RAG、Tool Calling、Guardrails 绕晕。那它们之间到底是什么关系呢?今天我们就根据这张全景图,用一篇文章讲清楚——LangChain 生态到底是怎么分工协作的。
2026-03-18 21:21:15
536
原创 大模型扫盲必看:100个核心概念全解析,小白与程序员建议收藏
本文系统梳理了大模型全栈知识,涵盖概念定义、数据标注、训练原理(Transformer/微调)、评估指标、平台应用(RAG/Agent)及安全政策。从基础到前沿,帮助程序员和小白快速构建知识体系,是不可多得的入门指南。
2026-03-17 21:26:24
400
原创 大模型RAG入门必看:向量嵌入与检索方法全解析,
深入解析RAG核心:从BM25关键词检索到向量语义检索,详解BGE-M3多功能嵌入及多模态检索,推荐混合策略,助你掌握大模型RAG必备技能。
2026-03-17 21:25:36
371
原创 GPT-5.4发布!小白程序员必备:收藏这份大模型学习指南,开启AI新时代!
GPT-5.4发布,成为OpenClaw的首选模型,具备强大的代码能力、世界知识和多模态理解能力。相比Claude Opus 4.6,GPT-5.4在真实工作任务和软件工程问题解决上表现出色,且价格更亲民。此外,GPT-5.4还拥有100万token的上下文窗口、原生计算机使用能力和工具搜索等新特性,为AI应用带来更多可能性。建议小白和程序员们收藏此指南,开启AI学习之旅。
2026-03-09 21:21:53
418
原创 程序员必看:Ollama + AnythingLLM,轻松部署本地大模型
本文介绍了如何使用Ollama和AnythingLLM快速简单地在本地部署大模型。首先,指导用户安装Ollama并从Ollama的模型库中选择和下载模型(如llama、qwen、deepseek等)。接着,详细说明了如何配置和使用AnythingLLM以运行已下载的模型。此外,还讨论了在下载模型时可能遇到的问题及解决方案,如网络问题。最后,文章建议用户在模型下载过程中遇到困难时,可以考虑使用离线模型。整个过程操作简单,适合对大模型部署感兴趣的小白和程序员。
2026-03-09 21:21:07
374
原创 大模型部署指南:小白也能看懂!收藏这份超全技术选型攻略
本文深度解析了四大主流大模型部署框架:Ollama(本地快速部署)、llama.cpp(低配设备优化)、vLLM(高并发生产环境)和LM Studio(跨设备开发)。文章详细介绍了各框架的核心价值、技术亮点和适用场景,并提供了方案选型决策树和混合部署实战案例。最后展望了边缘智能、量化革命和多云部署等未来趋势,强调选择匹配场景的部署方案对AI工程化落地的重要性。
2026-02-27 19:17:04
307
原创 小白程序员轻松上手部署DeepSeek大模型,开启AI创新之旅
本文介绍了DeepSeek大模型的开源特性及其对全球AI竞争格局的影响。详细阐述了DeepSeek R1模型的本地化部署流程,包括运行环境要求、依赖工具安装以及可视化部署方法。通过Ollama工具下载并运行DeepSeek R1模型,实现本地化部署,保障数据安全并灵活定制业务场景。DeepSeek大模型为企业智能化转型提供了可靠的技术底座,展现了与私有化场景深度融合的技术潜力。
2026-02-27 19:16:02
284
原创 小白程序员必备!轻松入门大模型架构设计
本文深入浅出地介绍了软件架构的核心概念,包括架构的理解、4+1模式、C4模型、TOGAF-4A架构以及互联网模型的实际应用。文章详细阐述了业务架构、产品架构、应用架构、技术架构和代码架构的设计原则与实现方法,旨在帮助初学者系统地掌握系统架构设计的方法论,为构建高效、稳定的软件系统打下坚实基础。
2026-02-18 19:41:22
812
原创 深入OpenClaw Agent核心:工作区、架构、调度与容错机制
本文深入剖析了OpenClaw(原Clawdbot)的核心动力模块——Agent任务引擎,揭示了其架构设计、工作区划分、调度并发控制及高可用容错机制。通过分析OpenClaw的实践,文章强调了理解这些工程智慧对于构建稳健生产级Agent系统的价值,并指出了如何将实践沉淀为规范,以更精准地指导AI。文章还讨论了如何在企业级落地中参考OpenClaw的架构实践,并指出了其代价和解决方案。
2026-02-18 19:40:20
1178
原创 AI大模型时代,小白也能掌握创业哲学:从管人到管Token的范式转移
文章探讨了AI Agent进入组织后,管理哲学的变化。传统管理以“管人”为核心,而AI Agent的不确定性和管理方式与传统团队不同。文章重点分析了AI Agent权限设计、Token管理、人机协作实践以及与传统管理的异同。提出了为一人公司设计AI Agent管理框架的建议,包括将Token视为核心资源、建立三级授权体系、解耦推理引擎与执行能力、设计可观测性系统以及从管理者转变为架构师。文章最后讨论了AI Agent时代情绪价值的破产,以及组织进化的方向。
2026-02-18 19:38:08
955
原创 小白程序员入门大模型:AI Agent技术架构深度解析与实践
本文深入探讨了构建AI Agent的技术架构,介绍了人大与OpenAI提出的两种主流框架,并总结出包含感知、记忆、规划、行动等八大模块的完整架构。通过解析各模块的功能与协同机制,阐述了AI Agent如何接收环境信息、规划决策、执行行动并进行学习优化,为小白和程序员提供了构建智能体的实用指导。
2026-02-18 19:36:56
883
原创 AI技能大揭秘:小白程序员必看!如何用收藏技巧提升Agent效率
本文探讨了为AI Agent编写技能的效果,研究表明人工编写的Skills平均提升16.2个百分点,但效果因领域差异显著,医疗领域提升51.9%,软件工程仅4.5%。研究发现AI生成的Skills无效,提出聚焦具体任务、控制模块数量、人工编写和定制场景等四条实操建议,强调Skills质量比数量重要,人工定制效果更佳。通过实例说明,优化Skills可显著提升Agent效率,甚至小模型加好Skills能追上大模型,性价比高。
2026-02-18 19:36:06
647
原创 小白程序员必看:Context Graph如何让AI真正理解企业运作
本文深入解析了企业AI新热点Context Graph(上下文图谱),它通过记录企业决策路径、显影被忽略的工作流,让AI从单纯“搜内容”升级到“懂关系”。文章强调隐性流程才是关键资产,系统需捕捉“怎么做”反向推断“为什么”,并需与多种AI能力协同。实践证明,Context Graph是AI嵌入业务的基础设施,推动AI投资从模型转向上下文资产积累,率先建立者将引领Agentic Automation新阶段。
2026-02-18 19:35:14
918
原创 10种AI产品形态深度解析:小白也能看懂的大模型应用与收藏(附原型库)
本文梳理了当前市场上的10种主流AI产品形态,包括对话式AI、嵌入式AI(Copilot)、生成式工具、智能体、AI搜索、情感陪伴AI、数据洞察AI、内容增强/润色、AI硬件和AI原生工作流平台。文章分析了每种形态的技术本质、解决的问题及商业模式,强调理解这些基础形态有助于判断AI产品的创新性。同时,作者还提供了一套包含500个原型模板库的资源,以辅助读者更好地理解和应用这些AI产品形态。
2026-02-18 19:34:13
965
原创 Skill小白的进阶指南:如何写好Skill,技能创建器Skill-creator的设计思路全解析(收藏版)
本文深入解析了Skill的概念、编写方法和技能创建器Skill-creator的设计思路。首先介绍了Skill的定义和最小形态,即一个包含指令文档、参考资料、可执行脚本等资源的文件夹。接着,文章详细阐述了Skill的完整结构,包括SKILL.md、scripts/、references/、assets/和agents/openai.yaml等文件的作用。文章重点分析了如何给AI编写指令,强调了简洁性原则和三级分层架构的重要性。此外,文章还讨论了给AI多大自由度的设计维度,以及skill-creator的六步
2026-02-18 19:33:02
4152
1
原创 掌握RAG核心:分层检索策略,在“准”与“全”间找到完美平衡,面试必备!
本文深入探讨了RAG检索增强生成技术的核心,强调其关键在于实现“准”和“全”的平衡。文章介绍了成熟的RAG方案分层设计:召回层采用多路并进策略,融合层通过分数归一处理多路召回结果,精排层则利用精准重排模型筛选出高质量上下文。最终总结为RAG的核心是用分层设计在“准”与“全”间做到极致平衡,对面试者和AI从业者具有重要指导意义。
2026-02-18 19:32:07
796
原创 告别AI泔水设计:Agent Skills标准让AI输出工业级成果
Anthropic推出的Agent Skills标准是一套可复用指令集,能让AI Agent按需挂载特定场景能力,解决提示词重复撰写和占用上下文的问题。Skills门槛低、通用性强,已被OpenAI、VS Code等主流工具兼容。国内特赞团队推出的skill0平台已聚合423个通用Skills,只需下载对应文件到指定目录,就能让AI稳定输出符合场景要求的结果。2026年或将成为Skills规模化落地的元年,国内团队已在这场技术变革中占据先机。
2026-02-09 19:24:31
945
原创 用通俗的方式介绍大语言模型训练过程
站在大语言模型外部看需要准备些什么样的训练数据,分什么阶段,怎样去训练大语言模型,把大语言模型看成一个黑盒。LLM都是如何训练出来的呢?**GPT的训练**分为以下3个阶段:1、预训练Pretrain2、监督微调SFT (Supervised Fine-Tuning)3、基于反馈的强化学习RLHF
2026-02-09 19:23:44
830
原创 RAG技术深度剖析:让大模型从“瞎编“到“有据可依“的三大形态与应用指南
文章系统介绍了RAG(检索增强生成)技术的三大核心形态:传统RAG通过检索知识增强回答准确性;Graph RAG利用知识图谱理解信息间关系;Agentic RAG赋予AI自主解决问题能力。详细讲解了RAG的落地策略、注意事项、技术选型和实际应用案例,强调RAG能让AI从"瞎编乱造"变成"有据可依",提升回答准确性和可靠性,是程序员掌握大模型应用的关键技术。
2026-02-07 11:09:57
552
原创 深入解析Claude Agent Skills:让大模型变身专家的模块化技术
本文详细介绍了Claude的Agent Skills功能,这是一种模块化能力,可扩展Claude的功能。Skills包含指令、元数据和可选资源,采用渐进式披露机制,按需加载内容,减少上下文消耗。文章探讨了Skills的优势(专业化、减少重复、组合功能)、使用方法、工作原理、在不同平台的应用、结构要求和安全考虑。Skills通过基于文件系统的架构,使Claude能够访问特定领域的专业知识,将通用代理转变为专家。
2026-02-07 11:08:58
549
原创 智能体(Agent)开发19条实战经验:从业务需求到系统架构全解析
本文总结了智能体(Agent)开发的19条实战经验,强调需明确业务边界而非追求全能,知识库应按场景拆分提高可检索性,建立完善的测试集和badcase库,采用"80%草案+20%人工确认"模式,注重时效性与数据安全,通过分层架构和确定性逻辑保证稳定性,建立全链路日志和可解释性机制,并强调交付需包含运营机制确保长期效果。
2026-02-07 11:07:52
352
原创 大模型应用工程师成长指南:零基础到50万年薪的完整学习路径
文章详细介绍了大模型应用工程师的完整学习路线,包括提示词工程、检索增强生成(RAG)、模型微调、模型部署以及人工智能系统和项目五大核心模块。这一路线旨在帮助学习者掌握大模型应用的关键技术,从基础概念到实践应用,最终能够参与开源项目并实现大模型在各行业的落地应用。目前正是入门大模型领域的最佳时机,掌握这些技术可获得可观薪资回报。
2026-02-06 10:36:45
537
原创 从RAG到上下文工程:解决大模型“Lost in the Middle“问题的实战指南
本文探讨了AI领域从"模型不知道"到"知道太多"的转变,分析了"Lost in the Middle"问题成因,提出上下文工程作为新范式。文章详细介绍了五大实践方法:上下文卸载、压缩、任务隔离、分层动作空间和精细化Prompt,帮助开发者优化长上下文场景下的模型表现,提升Agent落地效果。
2026-02-06 10:35:57
1063
原创 多模态RAG完全指南:两种核心实现方式详解,收藏必学
本文详细介绍了多模态RAG系统的两种实现方式:间接表示法(通过文本模态表示其他模态数据)和直接表示法(将不同模态映射到统一向量空间)。文章还探讨了多模态融合(早、中、晚期融合)和跨模态对齐(显式、隐式对齐)等关键技术。多模态RAG需要专门的多模态Embedding模型,能够充分利用不同模态间的互补性,是未来AI发展的重要方向。
2026-01-31 18:28:44
1321
原创 大模型RAG技术演进指南:从朴素智能到自主决策,程序员必备
文章详细介绍了检索增强生成(RAG)技术的四个演进阶段:从Naive RAG确立基本范式,到Advanced RAG引入精细化优化,再到Modular RAG追求架构灵活性,最终Agentic RAG实现自主决策与智能化。RAG技术从简单的"知识搬运工"逐步进化为能够进行复杂推理的"智能决策者",未来将向多模态、实时化和可信AI方向发展。
2026-01-31 18:28:05
782
原创 小白也能学会的AI Agent架构设计:Open Deep Research三级分层结构实战解析
本文深入解析Open Deep Research项目的多Agent架构设计,采用三级分层嵌套结构:主图负责整体流程编排,监督者子图实现任务分解与委派,研究者子图执行具体研究。通过LangGraph的子图复用和异步并行机制,实现职责分离与高效协作,为构建复杂多Agent系统提供了优秀范例。
2026-01-30 19:16:18
1136
原创 RAG系统工作流程全解析:从入门到精通的大模型应用指南
RAG技术通过结合大型语言模型的生成能力与外部知识库,实现了可靠的知识闭环。文章详细解析了RAG系统的四大工作流程(查询解析、文档检索、信息整合与回答生成),深入探讨了三大核心组件(数据预处理、嵌入技术、向量存储),并介绍了高级优化策略如HyDE和重排序技术。最后提出了RAG系统的评估体系和未来发展方向,为开发者提供了从理论到实践的完整指南。
2026-01-30 19:15:27
1365
原创 从零开始构建AI Agent:详解六大核心模块,大模型开发实战指南
文章介绍了AI Agent系统的六大核心模块:感知、决策规划、执行、专业大模型、记忆管理和反馈系统。这些模块协同工作形成完整智能闭环,使AI Agent能够感知环境、自主决策、执行任务并持续进化。通过金融数据分析智能体的案例展示了具体实现,并讨论了模块化、边缘智能融合等未来趋势。
2026-01-29 19:01:10
1086
原创 Agent Skills vs MCP vs A2A:大模型智能体能力、工具与协作的全面解析
Anthropic发布Agent Skills开放标准,定义智能体"能力"单元,与MCP工具、A2A协作形成互补。其渐进式披露特性解决上下文限制,结合LLM与确定性代码执行。通过将业务流程打包成可复用技能,降低经验注入大模型的技术复杂度。Agent Skills标志着智能体开发从单体架构向微服务、组件化转型,未来竞争将围绕能力单元生态展开,为AI世界定义"操作系统层"和"包管理协议"。
2026-01-29 19:00:06
679
原创 AI智能体实战:30分钟搭建零代码营销自动化工作流,程序员必学收藏
文章介绍如何利用AI智能体、MCP协议和n8n零代码平台构建营销自动化工作流。通过MCP协议,营销人员可直接访问AppsFlyer数据;结合n8n平台,可快速搭建自动化投放报告和成本预警两大核心工作流,无需依赖开发团队。这些工具帮助节省时间,提高效率,实现数据驱动的营销决策。
2026-01-28 18:05:59
823
原创 三天搭建企业级Agent!大模型深度嵌入业务实战教程
大模型技术正从"泛化对话"向"深度业务嵌入"转变,企业级Agent成为核心战场。企业需要可本地部署、高度定制化的智能体架构,而非通用聊天机器人。作者分享三天搭建企业级Agent的实战经验,提供面向新手的教程。展望未来,多模态Agent和自主规划系统将更受重视,开发者应将大模型学习纳入长期建设,掌握AI时代话语权。
2026-01-28 18:05:13
532
原创 AI智能体完全指南:无需编程基础,四步打造专属AI助手
本文详解AI智能体搭建方法,从入门到进阶,包括四步创建流程、个性化设置、知识库运用和指令迭代技巧。文章强调将AI视为协作者而非工具,根据场景选择适合的大模型,并提供多个国内免费平台推荐。无需编程基础,即可打造专属AI助手,提升工作效率。建议收藏实践,通过日常使用掌握AI技能。
2026-01-24 19:10:16
654
原创 从小白到程序员,AI知识库搭建全攻略:大模型学习必备指南
文章对比AI知识库与传统知识付费的区别,指出AI提供可调用能力而非单向内容。详解搭建个人知识库的九个步骤,从问题定义到测试迭代,强调核心是解决问题而非简单结构化内容。AI知识库面临精准回答、可执行性和持续更新等挑战,适合职场人士和专业领域专家使用,是提升效率的实用工具。
2026-01-24 19:05:04
875
原创 AI应用架构演进:从信息顾问到智能执行者的实战指南
本文探讨AI应用从"信息顾问"到"智能执行者"的范式转变,详解LLM-native应用的设计架构与实现方法。对比AI Workflow与AI Agent两种设计模式,展示如何通过LangChain构建稳定高效的AI应用,并提出混合架构优势。介绍MCP协议解决AI与外部系统连接问题,为构建下一代智能应用提供实用指南。
2026-01-22 18:50:40
693
原创 突破RAG系统瓶颈:多路召回架构设计与实践
文章指出RAG系统的瓶颈不在模型,而在多路召回设计能力。单一路径(如向量检索)仅解决"相似性"而非"完整性"问题。真正的多路召回应包含语义、词法、结构和关系四种并行视角,通过Query Rewrite创造多条检索入口,Metadata Filter排除不可能的文档,Hybrid Retrieval实现并行检索,最后由Rerank收敛结果。这种架构能构建可解释、可评估、可演进的稳定RAG系统。
2026-01-22 18:49:38
704
原创 从能跑到能用:大模型智能体技术演进与工程化实践
文章介绍了大模型智能体技术的演进历程,从LangChain的基础设施作用,到LangGraph引入状态管理实现稳定执行,再到Deep Agents提升任务成功率和自主性。三者分别让智能体"能动"、"稳定"和"聪明",共同推动了从"能跑"到能用"的产业化进程,为构建企业级智能体应用提供了系统化的方法论与工程化体系
2026-01-14 16:19:40
583
原创 11种大模型参数高效微调方法全解析,从LORA到LongLORA助你轻松掌握大模型优化
本文系统介绍了11种大模型参数高效微调方法,包括前缀调优、提示调优、LORA及其变种(LongLORA、VeRA、S-LORA等)等。这些方法通过冻结原始模型参数,仅优化少量可训练参数,显著降低了计算资源消耗,同时保持了模型性能,为不同规模的大模型提供了灵活高效的微调解决方案。
2026-01-14 16:16:51
615
原创 AI记忆架构选择指南:Agent记忆与RAG的7大区别,一篇就够了
文章对比了AI记忆架构的两种技术路径:Agent记忆和RAG。Agent记忆通过动态演化、主动学习和分层架构实现持续进化,擅长长周期推理和多轮对话;而RAG作为静态检索系统,在静态知识查询中保持优势。随着2025年技术演进,混合架构成为趋势,让Agent记忆负责动态认知,RAG处理静态检索,形成更高效的AI记忆系统。选择应基于应用场景需求,而非简单替代关系。
2026-01-13 15:25:54
750
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅