- 博客(1216)
- 收藏
- 关注
原创 新手程序员必收藏!AutoGen、AgentScope、CAMEL、LangGraph Agent 框架怎么选
文章从手写 Agent 的困境出发,阐述了随着复杂度提升,手写方式难以维护的问题,进而引出 Agent 框架的必要性。文章详细介绍了 AutoGen、AgentScope、CAMEL、LangGraph 四种主流 Agent 框架的设计哲学、特点、优缺点及适用场景,并提供了选型建议。 帮助读者更好地理解和应用 Agent 框架。
2026-03-09 21:23:55
346
原创 掌握Skills,让通用Agent搞定所有工作场景——新手程序员必备收藏指南
Anthropic提出“构建Skills而非专业Agent”的新范式,强调通过通用Agent结合Coding实现跨领域工作。文章介绍了Skills的概念、特点(设计简单、渐进式披露、含脚本工具)及其分类(基础、合作伙伴、企业技能)。此外,还探讨了Skills与MCP协同、非开发者应用等趋势,并给出了完整的Agent系统架构图。
2026-03-09 21:22:58
355
原创 轻松入门大模型开发:用mcp-use连接LLM与MCP服务器
本文介绍了mcp-use,一个开源Python库,用于连接LLM和MCP服务器,简化AI智能体开发。它支持任何LangChain兼容的LLM提供商,提供多种连接方式、沙盒执行等功能,并允许通过JSON配置连接各种MCP服务器。使用mcp-use,开发者可以轻松构建具有工具访问能力的自定义智能体,降低大模型和AI Agent开发的门槛。
2026-02-27 19:18:48
518
原创 轻松掌握GPU分区技术在Windows Server 2025上的部署与收藏
本文详细介绍了在ShareStation工作站虚拟化方案中部署Windows Server 2025、DoraCloud并创建带有vGPU的虚拟桌面的过程。通过GPU分区技术,实现了多个虚拟机共享同一物理GPU,同时保持高性能。文章还介绍了软硬件环境配置、部署步骤以及如何使用DoraCloud V4.0支持GPU分区和NVIDIA vGPU 18.0。对于希望提升虚拟化技能的小白和程序员来说,本文提供了实用的指导和收藏价值。
2026-02-27 19:17:54
386
原创 小白程序员必看:轻松掌握BERT大模型,收藏学习这份超全指南
本文详细介绍了BERT大模型的核心概念、算法原理及最佳实践。从预训练模型的基本思想到Transformer的自注意力机制,再到BERT的双向编码器,文章深入浅出地讲解了BERT的工作原理。此外,还提供了使用BERT进行文本分类的代码实例和详细解释,帮助读者更好地理解和应用BERT。文章还探讨了BERT的实际应用场景,推荐了相关工具和资源,并展望了未来发展趋势与挑战。通过本文,读者能够系统地学习BERT大模型,为自然语言处理任务打下坚实基础。
2026-02-18 20:06:03
389
原创 小白程序员必看:轻松掌握BERT大模型,收藏学习这份超全指南
本文详细介绍了BERT大模型的核心概念、算法原理及最佳实践。从预训练模型的基本思想到Transformer的自注意力机制,再到BERT的双向编码器,文章深入浅出地讲解了BERT的工作原理。此外,还提供了使用BERT进行文本分类的代码实例和详细解释,帮助读者更好地理解和应用BERT。文章还探讨了BERT的实际应用场景,推荐了相关工具和资源,并展望了未来发展趋势与挑战。通过本文,读者能够系统地学习BERT大模型,为自然语言处理任务打下坚实基础。
2026-02-18 20:05:26
237
原创 LangChain大模型应用入门教程:小白程序员必备,收藏学习!
LangChain是一个开源Python库,帮助开发者构建基于大语言模型的应用。它提供统一接口管理多种基础模型,支持提示管理,并整合提示模板、外部数据等组件。教程介绍了环境搭建、API密钥获取、六大核心模块(Models、Prompts、Chains、Indexes、Memory、Agents)的使用,帮助读者快速上手大模型应用开发。
2026-02-18 20:04:34
387
原创 Android AI大模型学习指南,小白也能轻松上手
本文全面介绍了如何在Android平台上集成和使用AI大模型,从基础概念到实际代码实现,逐步引导开发者了解如何在Android平台上使用AI大模型。内容涵盖了AI大模型的基础概念、常见类型、训练和推理过程,并讨论了选择适合Android的大模型时需要考虑的因素,如模型大小、推理速度和性能表现。此外,还提供了在Android项目中集成AI大模型的详细步骤,包括环境搭建、模型转换、模型加载和初始化等。文章还详细讲解了在Android上进行模型推理的过程,包括输入数据预处理、模型推理和输出结果处理。为了提高模型的
2026-02-18 20:00:32
446
原创 新手小白也能轻松上手!LM Studio本地大模型实测指南
本文详细介绍了如何使用LM Studio这一轻量级本地大模型推理工具,在Windows和macOS系统上启动并测试LLM。教程涵盖LM Studio的安装、模型下载(支持Llama.cpp引擎及多种模型)、配置和测试步骤,并配有截图。内容还包括本地大模型部署方式对比、GPU加速设置及参数优化建议,适合AI初学者和开发者进行本地大模型部署和体验。
2026-02-18 19:58:52
962
原创 本地部署大模型:新手友好,数据隐私有保障
本文介绍了本地部署大模型的核心优势,如数据隐私、零成本使用、离线可用等,并详细对比了LM Studio、Ollama和Open WebUI等主流本地部署工具。推荐LM Studio因其可视化界面简单易用,适合新手快速入门。文章还提供了LM Studio的安装、模型下载、启动及对话步骤,并分享了性能优化建议和常见问题解答。最后,介绍了如何通过LM Studio调用本地模型的OpenAI兼容API接口,为AI应用开发奠定基础。
2026-02-18 19:57:38
611
原创 5分钟快速上手大模型:Hugging Face新手入门指南
本文将带你5分钟内完成从环境配置到模型运行的全过程,体验LLM的强大功能。文章介绍了Hugging Face平台及其优势,包括安装Python环境、安装Hugging Face库、使用Pipeline快速调用预训练模型、加载和使用不同类型的模型、进行文本生成和分析、优化模型运行性能等。通过学习本文,你将掌握使用Hugging Face快速上手LLM的基本方法,为后续深入学习打下基础。
2026-02-18 19:56:52
638
原创 小白程序员快速入门LangChain大模型框架,轻松构建AI应用
LangChain是一个强大的开源框架,专为构建大语言模型应用而生。本文介绍了LangChain的核心模块,包括模型、提示、链、代理、记忆和索引,并详细阐述了每个模块的功能和应用场景。通过学习LangChain,程序员可以快速掌握大模型开发技术,构建出功能丰富的AI应用。
2026-02-18 19:55:55
532
原创 大模型ReAct架构全解析:从理论到实战,一篇搞定,赶紧收藏!
ReAct是一种大语言模型架构模式,结合推理(Reasoning)与行动(Acting),通过交替进行内部思考和外部工具交互来解决复杂问题。它克服了纯链式思考(CoT)无法获取实时信息的局限,形成"思考-行动-观察"闭环反馈系统。ReAct的核心价值在于提升信息检索任务20-40%的性能,增强推理透明度,提高容错能力,使AI系统能够像人类一样动态解决问题。
2026-02-09 19:26:49
827
原创 深入浅出理解AI Agent与Skills:大模型应用开发的核心原理
文章揭示了AI Agent的本质——即循环调用工具的大模型,并无神秘之处。重点解析了Agent Skills的概念,它是一套预设的工具、提示词和工作流组合,可理解为Meta-Tool(元工具),实现了从Agent到普通工具之间的能力抽象。Anthropic发布的Agent Skills开放标准提供统一实现,简化了开发者设计能力架构的心智负担,使Agent开发更加高效。
2026-02-09 19:26:00
667
原创 掌握大模型智能体:一篇值得收藏的实战开发指南
本文详细探讨了大语言模型驱动的智能体系统构建方法,分析了LLM在自然语言理解、知识推理和持续学习方面的核心作用,介绍了Agent三层架构及上下文管理机制,讲解了智能体与API、向量数据库的集成技术,并解析了ReAct、Hugging Face和LangChain等框架的应用,为开发者提供了一套完整的智能体系统实现方案。
2026-02-09 19:25:24
571
原创 Claude Agent Skills第一性原理深度解析:基于提示词的动态上下文注入与元工具架构详解
Claude Agent Skills是基于提示词的动态上下文注入与元工具架构,通过将SKILL.md中的高阶指令"植入"模型大脑而非执行代码来扩展能力。它采用渐进式披露机制,在需要时动态加载特定领域知识,同时修改对话上下文和执行权限。Skills与传统提示语的核心区别在于动态按需加载、元工具架构、双重上下文修改和双通道通信,实现了功能的无限扩展和按需加载。
2026-02-07 11:12:15
581
原创 RAG技术深度剖析:让大模型从“瞎编“到“有据可依“的三大形态与应用指南
文章系统介绍了RAG(检索增强生成)技术的三大核心形态:传统RAG通过检索知识增强回答准确性;Graph RAG利用知识图谱理解信息间关系;Agentic RAG赋予AI自主解决问题能力。详细讲解了RAG的落地策略、注意事项、技术选型和实际应用案例,强调RAG能让AI从"瞎编乱造"变成"有据可依",提升回答准确性和可靠性,是程序员掌握大模型应用的关键技术。
2026-02-07 11:10:59
416
原创 智能体工程:从Demo到产品,打造可靠生产级Agent系统的10大工程维度
文章探讨了智能体工程这一新兴领域,关注如何将基于LLM的智能体从Demo演进为生产级系统。文章介绍了智能体工程的定义、使命和四层能力架构,并详细阐述了10个核心工程维度,包括交互、模型、推理、上下文、记忆、知识、集成、可观测性、安全和治理工程,旨在解决LLM不确定性、上下文管理、工具集成、可观测性、安全性和治理等问题,确保智能体在企业环境中可靠运行。
2026-02-06 10:40:34
752
原创 LangChain与MCP集成完全指南,解决6大核心问题
本文深入探讨LangChain与Python MCP集成的六大核心挑战:接口抽象冲突、状态同步问题、性能损耗、版本兼容性、调试困难及安全管控缺口。针对每个问题,提供系统化解决方案,如开发统一数据转换中间层、全异步改造、版本锁定策略等。强调在保持LangChain灵活性的同时,需平衡MCP的标准化,企业级应用应优先考虑适配层的精简与可维护性。
2026-02-06 10:38:04
399
原创 AI智能体构建指南:2大核心架构+9种设计模式,让小白也能快速上手
本文详细解析了智能体应用的两大核心架构(单智能体和多智能体)和九种设计模式,强调架构设计比大模型选择更重要。文章介绍了单智能体的五种模式和多智能体的四种模式,并提供了实际案例和决策框架,帮助开发者根据具体用例选择合适的架构方法,是构建高效智能体应用的实用指南。
2026-01-31 18:30:45
848
原创 大模型提示工程(Prompt Engineering)详解:让AI更懂你的艺术
本文介绍了大模型提示工程这一新兴范式,通过精心设计的Prompt引导模型直接适应下游任务,无需繁琐微调。文章详细阐述了上下文学习(零样本、单样本、少样本)和思维链(按部就班、三思后行、集思广益)两大核心技术,以及任务说明明确、上下文丰富清晰等实用技巧,是解锁LLM潜能的关键。
2026-01-31 18:29:54
1071
原创 一文读懂大模型训练全流程:从文本到智能的7个关键步骤
本文详细解析了大语言模型的完整训练流程,包括输入处理(分词、嵌入、位置编码)、解码器层结构(多头自注意力与前馈网络)、输出预测、反向传播,以及监督微调(SFT)、奖励建模(RM)和强化学习(PPO+RLHF)三阶段对齐技术。同时介绍了DPO替代方案及工程细节,揭示了GPT、Llama等模型从语言建模到人类对齐的技术演进。
2026-01-30 19:19:12
790
原创 大模型技术栈全解析:10个核心概念,让你的AI产品不再瞎指挥
本文详细介绍了AI产品开发必须掌握的10个核心概念:RAG检索增强生成、Agent智能体、函数调用、思维链、向量数据库、量化、蒸馏、LoRA低秩适配、剪枝和推理加速技术。每个概念都从定义、实现方法和应用注意事项进行解析,帮助产品经理和程序员理解AI产品开发基础,避免"瞎指挥"。文章还提供了原型库和PRD模板作为学习资源。
2026-01-30 19:17:43
746
原创 Transformer位置嵌入详解:从基础到RoPE解决词序感知难题
本文介绍Transformer模型中解决词序感知问题的三种位置嵌入方法:函数编码(sin/cos)、可学习位置嵌入和旋转位置编码(RoPE)。RoPE通过旋转词向量捕捉相对位置关系,配合PI和YaRN扩展方法可处理长文本输入。这些技术使模型能够理解语言中的顺序信息,解决了Transformer无法感知词序的关键缺陷。
2026-01-29 19:03:25
849
原创 ReAct模式详解:让大模型具备推理与行动能力,建议收藏学习
ReAct是一种将推理与行动结合在语言模型中的范式,通过Thought-Action-Observation(TAO)闭环机制实现模型与外部环境交互。该范式可减少幻觉、提高准确性和可解释性,适用于复杂决策环境、知识更新需求等场景。文章详细介绍了ReAct的背景、变体、功能、适用场景及实施方法,并通过代码示例展示如何使用LangChain框架实现ReAct代理,帮助开发者构建智能应用系统。
2026-01-29 19:02:37
599
原创 AI智能体实战:从小白到高手的完整学习路径
本文全面介绍AI智能体的构建与应用,从基础概念到生产级系统。详细解释智能体的ReAct循环工作原理,分析适合智能体的任务类型,系统介绍四大核心设计模式:反思、工具使用、规划和多智能体协作。提供从任务分解、评估方法到安全设置的全流程指导,帮助读者从零开始构建高效可靠的智能系统。
2026-01-28 18:07:55
983
原创 2025最新国产AI大模型排行榜(网站+APP端):收藏必备!从入门到精通的实战指南
本文基于2025年最新数据,全面解析国产AI大模型市场格局。数据显示,DeepSeek在网站端访问量居首,豆包在APP端领先,头部互联网企业占据竞争优势。文章建议普通用户可根据使用场景选择:网站端优先DeepSeek,手机端推荐豆包AI。这两款产品拥有强大技术和丰富用户经验,可满足大多数用户需求,是入门大模型的理想选择。
2026-01-28 18:07:05
1769
原创 小白也能上手!程序员必备的AI智能体低代码平台搭建全攻略
文章介绍了利用低代码平台构建AI智能体的方法与实践,分析低代码平台价值:降低门槛、提升效率、提供可视化调试和标准化最佳实践。详细对比三大平台(Dify、n8n、Coze)的特点与局限,给出选型建议:快速原型选Coze,企业级应用选Dify,深度集成选n8n。强调低代码与代码开发互补,可根据项目需求采用混合开发模式。
2026-01-24 19:11:44
672
原创 一文搞懂Transformer:大模型核心架构详解教程
本文介绍全面的Transformer学习教程,从基础概念到实战应用共分五章。讲解Transformer作为Seq2Seq模型的改进和注意力机制原理,深入解析Encoder和Decoder结构细节,通过机器翻译项目实战巩固理解。强调每个结构设计都有其原理,建议多看几遍以加深对这一大模型核心架构的理解,阅读一遍约需1-2小时。
2026-01-22 18:54:47
897
原创 突破RAG系统瓶颈:多路召回架构设计与实践
文章指出RAG系统的瓶颈不在模型,而在多路召回设计能力。单一路径(如向量检索)仅解决"相似性"而非"完整性"问题。真正的多路召回应包含语义、词法、结构和关系四种并行视角,通过Query Rewrite创造多条检索入口,Metadata Filter排除不可能的文档,Hybrid Retrieval实现并行检索,最后由Rerank收敛结果。这种架构能构建可解释、可评估、可演进的稳定RAG系统。
2026-01-22 18:53:58
825
原创 2025年RAG技术演进:从简单知识库到上下文引擎的全面解析
2025年RAG技术未因长上下文普及而淘汰,反而演变为更成熟的上下文工程。RAG从简单外挂发展为复杂系统,负责数据治理、索引和供给。技术重点从Prompting转向Context Engineering,架构实现搜索与阅读解耦,形态向RAR、Agentic RAG和Memory-Augmented RAG演进,成为Agent的通用上下文引擎。企业需构建强大Context Engine作为AI时代的基础设施。
2026-01-14 16:21:47
1086
原创 为什么你的RAG系统越聪明越不稳定?多路召回才是真正解决方案
RAG系统仅依赖向量检索会导致不稳定、不可预测。真实问题需要完整解决方案,而非单一路径召回。多路召回架构包括Query Rewrite、Intent Gate、Metadata Filter、Hybrid Retrieval、Rerank等组件,它们互补而非竞争。Metadata Filter解决逻辑可行性问题,是系统下限保障。多路召回使系统可解释、可评估、可演进,是RAG系统成熟的标志。
2026-01-14 16:20:55
899
原创 大模型新纪元:2025 Agent元年技术解析,AI开发者必学收藏指南
文章预测2025年为"Agent元年",指出大模型面临"算力墙"问题,边际收益递减,而AI Agent成为技术落地的合理路径。当前Agent产品因ROI不平衡受质疑,未来将向"自主智能体"发展,需两年时间实现技术突破,涉及推理加速、模型压缩、数据标准化等方向。尽管面临质疑,这些技术革新预示着下一轮AI爆发的前兆,将重塑编程和各类工作流程。
2026-01-13 15:28:12
541
原创 构建大模型智能体:从基础概念到主流框架的全面指南
本文系统介绍了大模型智能体(Agent)的核心概念、架构设计与实现方法。详细解析了PEAS模型、智能体循环、提示工程等基础理论,对比了ReAct、Plan-and-Solve、Reflection等主流架构,并深入分析了AutoGen、AgentScope、CAMEL、LangGraph等开发框架的特点与应用场景。同时介绍了低代码平台和本地推理工具,为开发者构建高性能智能体系统提供了全面的指导。
2026-01-13 15:27:08
323
原创 Ollama × 魔搭社区:超简单的大模型本地部署方案
随着大模型的不断发展,小参数模型的能力也在逐渐进步,就拿阿里最新开源的qwen3来说,其中有负责多模态的qwen3-vl系列和专为代码优化的qwen3-code系列等,这些不同使用场景中都有开源的小参数模型来方便我们本地部署。
2026-01-07 18:09:40
957
原创 从大模型到多模态,图文混排Agent彻底起飞~
上周是智谱的多模态开源周,从GLM 4.6v到Autoglm...看到官方的博客,第一眼比较吸引我的,不是模型本身,是他们给的一个使用场景 - **图文并排**。上传一份 PDF 论文,它能生成一篇图文混排的解读文章,而且效果非常好。图片位置精准,上下文衔接自然,完全不像是机械拼接的。
2026-01-07 18:08:52
929
原创 小白也能懂的AI智能体记忆系统:形式-功能-动态三维框架详解
本文系统综述了AI智能体记忆系统研究进展,提出"形式-功能-动态"三维分类框架。文章探讨记忆作为智能体核心能力的重要性,详细分析三种记忆形式(令牌级、参数化、潜在记忆)、三类功能角色(事实、经验、工作记忆)及其动态演化机制,为智能体研究提供理论基础,并讨论未来挑战与应用前景。
2025-12-31 18:24:38
1057
原创 AI Agent工程现状报告,企业部署数据与学习指南,建议收藏
AI Agent工程现状报告显示,超57%企业已将Agent投产,客服与数据分析为主要应用场景。质量是最大挑战,可观测性和评估体系成为标配。多模型策略主导市场,编码Agent领跑日常应用。Agent工程正从新兴概念发展为成熟学科,企业关注点从成本转向让Agent运行良好。
2025-12-31 18:23:29
885
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅