- 博客(1866)
- 收藏
- 关注
原创 大模型技术必备:Agent、MCP、A2A与Agent Skills精讲,值得反复阅读的技术指南
本文解析了大模型生态中的核心概念:Agent及其六种类型、MCP实现LLM与外部工具的无缝集成、A2A促进多智能体协作,以及Agent Skills标准化AI执行任务的方法论。这些技术共同构建了从基础LLM到产品级智能体的完整技术栈,为开发者提供了构建大模型应用的全套解决方案。
2026-02-24 18:30:52
652
原创 AI Agent入门必看:MCP与Skill区别详解,收藏这篇不再被名词党拿捏
本文用通俗语言解释AI Agent三大热词:AI Agent是能自主执行任务的"AI私人助理";Skill是外接的专项本领执行包;MCP是连接Agent与Skill的通用对接规范。三者的关系如同"主体+外接专长+连接规则",让AI更高效地帮人做事。掌握这三者的区别与联系,能帮助新手快速理解AI Agent领域,不被复杂术语劝退。
2026-02-23 20:43:14
713
原创 超详细Transformer架构解析:从分词到输出的完整流程
本文详细解析了Transformer架构的工作原理,包括输入数据处理(分词、词嵌入、位置编码)、Encoder模块(多头注意力机制、前馈网络、残差连接)和Decoder模块(掩码自注意力、交叉注意力)。Transformer摒弃了循环结构,通过自注意力机制实现序列建模,支持高度并行化,为现代大语言模型奠定了基础,是AI领域必学技术。
2026-02-23 20:42:12
544
原创 收藏必备!让AI Agent真正“能干活“:Agent Skills标准化技能完全指南
Agent Skills是一套"教Agent怎么做事"的标准化技能说明书,介于Prompt和Tool之间,提供明确场景、固定流程和稳定输出标准。它解决了Prompt的用完即丢、难以复用和Tool/MCP不负责流程的问题,采用渐进式加载机制节省Token。通过SKILL.md定义可执行行为流程,让Agent更像"真正会干活的专业员工"。文章提供了实战案例和配置方法,帮助开发者将常用Prompt升级为Agent Skill。
2026-02-23 20:37:52
631
原创 如何速成RAG+Agent框架大模型应用搭建?看完这一篇你就会了!!!
本文侧重于能力总结和实操搭建部分,从大模型应用的多个原子能力实现出发,到最终串联搭建一个RAG+Agent架构的大模型应用。
2026-02-19 13:49:50
595
原创 2026年开始学习AI,是否为时已晚?揭秘为何30+人群在AI领域更具竞争力
在人工智能迅猛发展的今天,不少35岁左右的朋友产生了这样的疑问:现在开始学习AI,是否为时已晚?事实上,30多岁的人学习AI不仅来得及,而且在某些方面还具有得天独厚的优势。以下是本文为您揭秘的35岁学习AI的可行性与优势。
2026-02-19 13:47:46
477
原创 【干货精选】2026年AI大模型应用开发学习路线图:后端开发者转型AI开发的最新指南!
文章提供了AI大模型应用开发的四阶段学习路径:基础概念与Prompt、RAG应用开发、Agent架构设计、微调与私有化部署。针对后端开发者,强调转型AI应用开发无需重新学习数学基础,而是将现有工程思维迁移到AI领域,将大模型视为强大API,通过提示词工程和业务逻辑组织实现功能。提供丰富学习资源,帮助读者系统入门并掌握AI应用开发核心技能。
2026-02-19 13:21:57
670
原创 100个AI Agent应用场景合集丨来看看Agent能在你的行业做什么!
人工智能代理(AI Agent)的发展正在以前所未有的速度改变我们的生活和工作方式。从日常生活的小事到企业级的复杂决策,AI Agent 的应用场景广泛且多样。
2026-02-19 13:18:40
480
原创 深度解析:大模型三大生成参数Top-k、Top-p和温度,小白也能懂!!
摘要:本文介绍了大模型文本生成中的三个关键控制参数:Top-k、Top-p和温度。Top-k通过限制候选词数量保证生成质量;Top-p(核采样)动态调整候选词池提高灵活性;温度参数控制输出创造性,低温度更稳定,高温度更创新。三者配合使用可平衡文本连贯性与多样性。文章还提供了AI大模型学习资源包,包含视频教程、学习路线、技术文档和面试资料等,帮助读者掌握大模型技术。(149字)
2026-02-19 13:16:16
712
原创 2026年AI大模型工程师岗位大全:全国名企职位一网打尽,抓住AI风口,机遇就在你手中!
本文汇总了全国多个行业的大模型相关招聘信息,涵盖算法工程师、数据工程师、产品经理等职位类型。涉及科技、金融、医疗、汽车等多个领域,包括字节跳动、腾讯、快手等知名企业的岗位需求,反映了AI行业对大模型人才的高度需求。职位分布广泛,为求职者提供了丰富的就业机会,是了解AI行业发展和职业规划的重要参考资源。
2026-02-19 13:10:07
753
原创 深度解析从RAG到多模态RAG,收藏这一篇就够了!!!
如果说2023年见证了大语言模型的“寒武纪大爆发”,那么2024年则是多模态大模型“元年”。GPT-4o的出现让大家见识到多模态能力引入,给下游应用生态带来的巨大改变。随之而来的,RAG技术也将逐渐从单语言模态的RAG进化到多模态RAG。本文将带大家速览多模态RAG技术的原理及实现
2026-02-15 21:29:06
510
原创 大模型ReAct框架—打造AI Agent的代码实现—基于LLM + Function Call构建Agent
AI Agent也就是AI智能体,是通过把大模型作为“大脑”,通过利用大模型的推理和规划能力,然后调用外部工具来完成复杂任务的一种方式。
2026-02-15 21:27:42
538
原创 【AI大模型】一文彻底搞懂人工智能的嵌入(Embedding)
*Embedding** 是一种机器学习概念,用于将数据映射到高维空间,将语义相似的数据放在一起。Embedding模型通常是 BERT 或其他 Transformer 系列中的深度神经网络,可以用一系列称为**向量(vectors)的数字**有效地表示**文本、图像和其他数据类型的语义**。这些模型的一个主要特点是,向量之间在高维空间中的数学距离可以表示原始文本或图像语义的相似性。这一特性开启了许多信息检索应用,如谷歌和必应等网络搜索引擎、电子商务网站上的产品搜索和推荐,以及最近流行的生成式人工智能中的检
2026-02-15 21:25:52
682
原创 揭秘程序员的核心能力:为什么说技术架构只是冰山一角?深度解析程序员的真正竞争力!
AI时代程序员的核心竞争力转变 随着AI技术快速发展,程序员的职业定位正从技术执行转向价值创造。AI在代码生成、架构设计等方面已超越多数开发者,未来竞争力将取决于: 软能力:深度思考、沟通协作、持续学习等人类独有特质 商业能力:产品思维、流量获取、解决实际商业问题的能力 强大内核:好奇心、抗压韧性等底层驱动力 建议开发者:将AI视为协作工具,投资非技术能力培养,用商业视角审视技术价值。在AI人才缺口达400万的背景下,掌握大模型技术将成为职业突围关键。 (注:已过滤推广内容,聚焦核心观点)
2026-02-13 00:17:36
485
原创 AI时代工作模式革命:揭秘人+智能体+机器人’新范式,重构未来职业与教育方向!
AI时代工作模式变革:麦肯锡报告揭示,未来将形成"人+智能体+机器人"的新协作范式。人类仍为核心生产力,但技能结构快速迁移,AI应用能力成为基础素养。报告指出,工作流程的AI化重构是释放经济潜力的关键,到2030年AI或为美国创造2.9万亿美元价值。教育体系需分阶段培养"AI流畅度",企业需重构业务流程。未来竞争力在于设计AI协作框架、提出正确问题的能力,而非单纯知识储备。这场变革中,学习速度将决定个人与企业的未来位置。
2026-02-13 00:15:26
367
原创 大模型浪潮下的IT行业变革:程序员职业转型启示,迎接AI编程时代的新挑战!
文章基于麦肯锡报告,探讨了AI时代工作模式的根本性变革,提出"人+智能体+机器人"的新工作范式。指出人类仍是核心生产力,但技能结构正在快速迁移,AI应用能力成为新时代基础技能。未来工作不是被AI替代,而是重构,人类将更多转向设计、监督与决策。为应对变革,个人需强化差异化能力,企业需重构工作流程,教育体系也需调整培养方向。
2026-02-13 00:11:45
630
原创 2026年程序员转型AI大模型:百万年薪不再靠熬资历,而是这三大核心能力!
2025年AI人才市场呈现结构性变革,大模型算法工程师月薪中位数达2.47万元领跑行业。92%科技企业将大模型纳入核心架构,但供需比仅0.5,顶尖人才极度稀缺。高薪岗位集中在三大方向:大模型算法研发与优化专家、"模型翻译官"提示工程师、AI智能体与多模态系统架构师。程序员转型需掌握模型深度理解、垂直领域融合和全链路工程化能力,建议分四阶段规划学习路径。市场更青睐能创造直接商业价值的复合型人才,但需避免盲目追逐热点、脱离业务价值等误区。随着AI深入各行业,安全合规思维成为必备素养。
2026-02-13 00:06:15
718
原创 【收藏必看】AI Agent时代:把行业经验封装成可复用的数字员工能力
文章介绍了AI Agent作为新一代应用范式,从传统软件工具向智能体的转变。详细阐述了AI Agent的核心架构、工程化关键技术,并通过金牌店长和调度老师傅两个岗位案例展示了如何将行业经验封装成Agent能力。文章强调了Agent工程不是简单的模型调用,而是设计可运营的智能体系统,并提供了从PoC到生产的完整落地流程与避坑指南。
2026-02-10 13:26:20
480
原创 收藏这篇!多智能体架构详解:从单Agent到群体协作的演进
文章介绍了AI智能体从"单兵作战"向"群体协作"的演变趋势,详细阐述了多智能体架构的核心思想(分工、协作、进化)、常见架构模式及实战应用场景。通过客户服务案例,讲解了如何利用LangGraph框架构建可运行、可观察、可治理的多智能体系统,强调了其在解决复杂业务场景中的优势及未来演进方向。
2026-02-10 13:23:21
419
原创 AI Agent资源感知优化模式:从成本失控到高效部署实战指南
文章介绍了AI智能体的资源感知优化模式,通过动态管理计算资源、时间和成本,使智能体根据任务复杂度选择合适模型(简单任务用轻量级模型,复杂推理用高阶模型)。多智能体协同架构(路由、执行、批判智能体)配合自适应工具选择、上下文剪枝等技术,帮助开发者控制API成本、降低延迟,平衡输出质量与算力消耗,打造高性价比的商用AI应用。
2026-02-09 13:38:26
602
原创 LangChain记忆管理深度剖析:Checkpointer、BaseStore与企业最佳实践
本文详细介绍LangChain 1.0的记忆管理机制,解析LangGraph中的持久化状态系统。阐述三大核心要素:State状态定义、Checkpointer检查点保存器和Thread ID线程隔离。对比短期记忆与会话生命周期绑定、长期记忆与用户生命周期绑定的区别,介绍长期记忆的向量数据库实现和跨线程记忆的BaseStore结构化存储方案。最后提出Checkpointer+BaseStore的企业级组合架构和性能优化策略,为大模型应用提供完整记忆管理解决方案。
2026-02-09 13:37:22
641
原创 大模型Agent记忆系统架构与实现:从理论到实践,收藏必备
本文详细介绍了AI Agent记忆系统的架构设计与实现技术,包括短期记忆和长期记忆的概念、区别及交互方式。重点阐述了短期记忆的上下文工程策略(缩减、卸载、隔离)和长期记忆的核心组件(LLM、向量化、向量数据库等)及Record & Retrieve流程。文章对比了各Agent框架的记忆系统实现,分析了行业发展趋势,并指出记忆系统作为AI Agent的核心基础设施,未来将向精细化、多模态和云服务方向发展。
2026-02-09 13:34:23
703
原创 多智能体架构完全指南:从单一智能体到提升90.2%性能的架构设计
本文详细解析了大模型应用中的多智能体架构选择策略,介绍了四种核心模式:子智能体、技能、交接和路由器,分别适用于不同场景。研究显示,恰当的多智能体架构可提升90.2%性能。文章通过对比各架构在分布式开发、并行化、多跳交互和直接用户交互方面的表现,帮助开发者根据需求选择最优架构。建议从单一智能体开始,仅在遇到上下文管理和分布式开发限制时才升级到多智能体系统。
2026-02-05 15:13:10
536
原创 大模型代理推理完全指南:从被动预测到主动行动的范式转变
本文探讨了大语言模型从静态推理向代理推理的范式转变,提出Agentic Reasoning三大层级:基础能力、自我进化和群体智能。分析了In-context和Post-training两条技术路线,介绍了Agent在科学发现、编程等领域的应用,指出未来AI竞争力在于构建强大的Agentic Loop——让AI能在环境中生存、记忆、反思和协作的系统设计。
2026-02-05 15:11:51
627
原创 深度智能体开发实战:基于LangChain与LangGraph的Python实现
本文系统介绍深度智能体的构建方法,涵盖其核心概念、架构组件及与LangChain、LangGraph的区别。深度智能体具备任务规划、上下文管理、子智能体机制和长期记忆能力,可处理复杂多步骤任务。文章提供了完整的Python实现代码和开发最佳实践,帮助开发者构建具备长期推理能力的智能体应用。
2026-02-03 13:21:36
671
原创 RAG完全指南:从嵌入到查询改写的五大核心技术(收藏必学)
本文详细介绍了RAG(检索增强生成)技术的五大核心概念:嵌入(文本向量化表示)、切片(文档拆分为小块)、相似度(计算文本相关性)、重排模型(优化检索结果排序)和查询改写(提高检索准确性)。RAG技术使大模型能访问外部知识库,突破静态数据限制,减少幻觉现象,并能提供信息来源引用,提升AI响应的可信度和可验证性,特别适用于对准确性要求高的场景
2026-02-03 13:20:26
533
原创 大模型Agent评估完全指南:提升AI应用稳定性的关键技术,开发者必藏!
文章系统介绍大模型Agent评估的重要性、组成、流程和方法。评估包括示例输入、标准答案、模型输出和分数四个关键部分,需通过开发集和留存集测试确保模型稳定性。详细讲解三种评估方法:基于代码评分(高效客观)、人工评分(细致主观)和基于模型评分(折中方案)。通过情感分析案例展示了如何进行评估和提示词优化,帮助开发者提高大模型应用的稳定性和可靠性。
2026-02-03 13:19:10
689
原创 快速搞懂五种主流AI Agent框架!解决选择困难~
AI Agent框架综述:加速大模型落地的关键工具 AI Agent框架正成为企业落地大模型的重要工具,通过提供标准化组件简化复杂AI系统的开发。主流框架包括LangChain(灵活集成LLM)、LangGraph(支持多Agent协作)、CrewAI(角色化团队协作)、Semantic Kernel(业务应用集成)和AutoGen(复杂任务处理)。这些框架通过模块化设计加速开发,促进标准化,提高可扩展性和可访问性。选择框架需考虑项目需求,如LangChain适合快速原型开发,CrewAI擅长模拟人类团队协
2026-01-30 09:55:41
686
原创 2026转行进入AI行业却不懂编程?解锁零编程基础也能驾驭的9大AI岗位
AI人才争夺战催生九大新兴岗位 随着AI技术快速发展,企业正积极布局各类AI相关岗位,其中九种无需编程技能的职位尤为引人注目。这些岗位包括:AI产品经理(负责技术商业化)、AI伦理专家(确保技术合规)、AI销售工程师(技术型销售)、AI业务分析师(优化业务流程)、AI数据标注员(训练数据管理)、AI提示词工程师(优化AI交互)、AI产品设计师(用户体验优化)、AI政策分析师(制定监管政策)以及AI行业专家(领域应用)。这些职位年薪跨度从6.5万至26万美元不等,反映了市场对复合型AI人才的高度需求。
2026-01-30 09:52:14
779
原创 一文搞懂大模型 - RAG技术(检索、增强、生成)
摘要: RAG(检索增强生成)是一种结合信息检索与语言模型生成的技术,通过检索外部知识库增强大语言模型(LLM)的生成能力,解决知识截止和幻觉问题。其流程包括:1)数据准备与向量化存储;2)检索相关片段;3)融合检索结果生成回答。RAG架构由检索模块(如双塔模型)和生成模块(如GLM)组成,广泛应用于问答、摘要等任务。该技术由Facebook AI于2020年提出,显著提升了生成内容的准确性与时效性。
2026-01-30 09:49:58
634
原创 从零开始构建AI Agent:2026年开发路线图与工具链全解析
本文全面介绍AI Agent开发七大技术层次:编程提示工程、基础架构、LLM调用工具集成、RAG推理、多Agent系统、UI部署及安全治理。涵盖2025年发展趋势:本地化部署、多模态融合、专业化发展和安全优先,并为不同水平开发者提供从入门到进阶的学习路径建议,是一份完整的AI Agent开发指南。
2026-01-29 10:27:06
856
原创 Java开发者转大模型:别丢了老本行,这才是你的核心胜算
咱们这些普通Java开发,每天守着CRUD、连数据库、配Redis,本来日子过得稳稳当当。结果ChatGPT、deepseek等一类AI一火,全网都在说AI要颠覆行业,心里难免打鼓:“我是不是得赶紧学AI?不然这饭碗还能端多久?
2026-01-29 10:24:38
668
原创 大模型Agent系统开发实战:工作流设计与最佳实践指南
本文基于Anthropic《Build effective agents》,详细介绍了构建大模型Agent系统的实战指南。文章从技术选型标准、设计模式应用到实施要点展开,详解了提示链、路由、并行化等核心模式,并强调工具提示工程是Agent成功的关键。作者主张保持系统简单性,仅在必要时增加复杂性,并通过透明设计和精心构建工具接口提高Agent性能。
2026-01-28 10:50:20
701
原创 一文讲懂Agent及其主流框架:自己想、自己干、自己复盘的才是好Agent!
Agent不稀奇,能“自己想、自己干、自己复盘”的才是好Agent」可一到落地,名词、框架和坑一起涌来:设计模式、强自治、可控流程、多代理协作.... 到底该不该用 Agent?
2026-01-27 18:00:32
753
原创 2026年大模型算法面试通关秘籍:200+精选题目与深度解析,助你斩获心仪Offer!
面试官可能会询问你对于特定领域(如医疗、法律等)大模型应用的理解和经验。至于是否需要刷算法题,这取决于具体的面试要求和公司的期望。一般来说,对于算法岗位,掌握基本的算法和数据结构知识是必要的,但在准备面试时,更重要的是理解和掌握大模型的相关理论和实践应用。
2026-01-26 09:15:00
621
原创 2026年AI大模型浪潮,Java程序员逆袭指南:从焦虑到新生,实现职业转型与价值升级!
在数字技术迭代速度不断刷新纪录的当下,AI大模型的爆发式发展(如ChatGPT、GPT-4、文心一言等)正以不可逆转的态势重塑各行各业,程序员群体首当其冲。曾凭借稳定需求与高薪待遇成为职场“香饽饽”的Java程序员,如今正站在技术变革的十字路口——传统编程技能的“保质期”大幅缩短,若不能紧跟技术潮流,很可能在新一轮行业洗牌中失去竞争力。
2026-01-26 09:15:00
1460
原创 大模型训练实战入门:深度解析学习大模型训练的必要性与前景!
文章系统介绍了大模型训练的必要性和价值,指出其在专业领域应用、学术研究和职业发展中的关键作用。详细解析了从数据处理、预训练、指令精调到对齐优化的完整训练流程,对比了大模型训练与RAG技术的区别,并提出了从基础到高级的系统化学习框架,帮助读者掌握从技术使用者到AI创造者的转变,提供了实战教程和算力支持资源。
2026-01-26 09:00:00
620
原创 RAG知识库质量优化全攻略:评估方法与改进技巧(收藏必备)
文章详细介绍了RAG知识库的质量评估与优化方法。首先构建了基于余弦相似度的评估指标体系(召回率、正确度、是否基于知识),并与RAGAS框架进行对比,指出RAGAS判断力更强但成本更高。随后提出了两大改进方向:提升召回能力(优化知识切片质量和调整embedding参数)和提升回答能力(使用更强模型、优化提示词)。强调知识库优化是系统性工程,需多方面综合考量。
2026-01-26 08:45:00
986
原创 大模型数值精度完全指南:FP32/FP16/BF16/FP8对比与应用实战!
本文详细解析了大语言模型中常见的数值精度格式(FP32、FP16、BF16、FP8)的结构特点与应用场景。文章探讨了不同精度对模型计算复杂度、推理性能和资源消耗的影响,并针对训练与推理不同场景提供了精度选择策略。同时介绍了模型量化技术,如BF16量化至INT8,可在保证推理精度的同时减少资源占用并提升性能。
2026-01-26 08:45:00
2161
原创 大模型RAG系统构建实战:基于Milvus的完整指南!
文章详细介绍了如何基于Milvus向量数据库构建高性能RAG系统,涵盖数据准备、向量检索、结果重排和位置优化等核心环节。重点讲解了如何通过位置优化突破U型陷阱提升22%准确率,并提供了生产环境最佳实践和性能优化技巧。包含完整代码示例,适合开发者从零开始构建RAG系统,是学习大模型应用开发的宝贵资源。
2026-01-25 09:00:00
1757
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅