自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(734)
  • 收藏
  • 关注

原创 一文读懂大模型智能体(Agent):从理论到实践

摘要: 大模型智能体(Agent)凭借自主决策、任务拆解和工具调用能力,正从理论走向实践。Agent通过“大模型基座+任务规划器+工具调用器”等核心模块,实现复杂任务自动化,个人可借助低代码工具(如AutoGPT)快速搭建,企业则需关注框架选型(如LangChain)和避坑指南(如任务拆解优化)。未来,Agent将在办公、客服等领域深度应用,技术趋向多模态交互与轻量化部署。 (字数:149)

2026-03-03 15:54:22 719

原创 2026年普通程序员转型大模型应用开发保姆级教程——从入门到精通,这一篇就够了!

先说我,传统后端开发入职阿里,工作一年后转大模型应用层。两年Agent、RAG经验,拿到字节超30%涨幅Agent开发岗位offer。我来回顾一下是怎么一个路径过来的。

2026-03-03 15:51:48 31

原创 [特殊字符] 浙大出品|大模型基础入门必读:这本书彻底杀死了我学大模型的混乱逻(附PDF+全套大模型学习籽料)

《大模型基础》学习指南 浙大出品的《大模型基础》系统讲解大模型核心知识,涵盖语言模型基础、Prompt工程、微调技术及RAG等6大模块,配套视频教程与实战案例。附赠全套学习资源包,包括开发教程、系统化学习路线、权威书籍及面试真题,助力从入门到精通。免费领取方式见文末二维码,适合2026年计划入门AI大模型的开发者。

2026-01-28 15:46:39 340

原创 2026移动端工程师AI大模型3个月速成计划:从App开发到智能体架构师!

你刚在手机上完成了一个丝滑流畅的列表滚动优化,而手机厂商们正将“端侧大模型”作为下一代旗舰机的核心卖点。这两个看似无关的瞬间,在2026年交汇成了移动开发者的最大机遇。你不再需要9个月,**只需90天**,就能将手中的UI组件转化为智能体,让大模型在你的应用里本地运行。

2026-01-07 14:55:33 1165

原创 文科生AI时代就业攻略:非技术岗位需求激增,薪资飙升230%,如何利用优势抓住机遇?

又到一年秋招季,文科生就业难问题再度进入公众视野当中。当前经济情况下的传统文科岗位缩水,更加剧了就业的严峻形势。但与此同时,AI的迅速发展催生出大量新兴岗位,给文科生带来了新机遇。2025年,仅AI+新媒体岗位数量就增长了230%,薪资涨幅同样引人注目。越来越多文科生,将目光投向转行AI。

2026-01-07 14:11:38 979

原创 提升Agentic RL效率的三大解决方案,让大模型训练不再卡顿!

本文聚焦Agentic RL效率瓶颈问题,介绍三类主流解决方案:第一类采用synchronous方式结合Tail Batching技术处理长尾问题;第二类实现asynchronous训推解耦,通过Streaming Rollout和Eager Batched Training提升效率;第三类通过multi-version actor和完全解耦的三阶段流程确保单步策略一致性。这些方案有效解决了长轨迹导致的训练效率低下问题,为优化大模型训练提供了实用思路。

2026-01-07 14:08:01 731

原创 LangChain与AutoGen对比:深度解析Agent框架选择标准,助你做出明智决策!

随着 2024–2025 年 AI Agent 的兴起,业界涌现出多款 Agent 框架。本文对比当前流行的框架。包括 LangChain、LangGraph、AutoGen、CrewAI、smolagents、OpenAI Swarm 和 OpenManus,分析它们的核心能力、功能特性、学习成本,并给出适用场景和推荐使用者类型。希望为想上手 AI Agent 开发的读者提供一份全面的指南。

2026-01-07 14:07:54 1125

原创 知识图谱+大模型:复杂度投资的明智之选?揭秘GraphRAG与智能技术的完美结合!

文章探讨知识图谱在生成式AI中的价值,既非万能解决方案也非无用技术。其真正价值在于提供多跳推理和可解释性,特别适合"为什么"和"如何"问题。通过GraphRAG和智能体记忆案例说明应用价值,建议先验证需求,从小规模开始,测量ROI。知识图谱最适合需要理解概念间多跳连接、关系与数据同等重要、需要可解释推理或构建持久智能体记忆的场景。

2026-01-07 08:30:00 1274

原创 35+程序员转型指南:大模型岗位薪资与路径全解析,揭秘破局关键,助你职场逆袭!

对于大多数程序员而言,职业发展到一定阶段,必然会遭遇转型的十字路口。这一关键节点的选择,往往决定了后续5-10年的职业高度,而转型方向无外乎三大主流:技术深耕升级、管理岗位跃迁、自主创业突围。

2026-01-06 13:54:26 360

原创 看到2026年AI薪资我惊呆了!算法岗月薪13万+,岗位翻10倍…

2025 年以来,AI 领域彻底 “火了”:新发岗位量同比暴涨 10 倍,仅 7 月单月增幅就超 10 倍;与此同时,简历投递量也同步增长 11 倍。但看似 “供需平衡” 的背后,人才供需比已从 2024 年的 1.00(人岗平衡)升至 1.11,意味着 “1.11 个求职者抢 1 个岗位”,部分核心岗位竞争更激烈。

2026-01-06 13:54:06 1668

原创 大模型微调完全指南:从SFT到LoRA/QLoRA的全面解析!

文章介绍了大模型微调的基础知识,重点讲解SFT(监督微调)方法,包括全参数微调、部分层微调和参数高效微调(PEFT)。详细解析了主流的LoRA和QLoRA微调原理与实现方法,以及微调训练的基本流程。文章强调微调是解决提示词工程局限性的有效方法,特别适合处理复杂任务和特定领域需求,并提供了系统化的学习路径和资源。

2026-01-06 09:10:43 825

原创 Agent工程:迭代优化非确定性LLM系统,实现可靠生产体验!

Agent工程是将非确定性LLM系统迭代优化为可靠生产体验的过程,遵循构建、测试、发布、观察、优化、重复的循环。它结合产品思维、工程和数据科学三种技能集,与传统软件开发不同,发布是学习的方式而非终点。随着LLM处理复杂工作流的能力增强,其不可预测性也带来了挑战。成功构建可靠Agent的组织采用快速迭代方法,将生产环境视为主要学习来源,通过系统化工作释放Agent能力。

2026-01-06 09:08:55 590

原创 AI智能体框架全解析:从AutoGen到LangGraph的选型与实战指南!

本文深入剖析了四种主流智能体框架AutoGen、AgentScope、CAMEL和LangGraph的设计理念与实战应用。从对话驱动协作到工程化多智能体平台,从角色扮演自主协作到图结构工作流,文章揭示了"涌现式协作"与"显式控制"的设计权衡,强调了工程化在智能体系统中的重要性。通过对比分析各框架的优势与局限性,为开发者提供了针对性的技术选型建议,助力构建可靠、可扩展的智能体应用。

2026-01-06 09:07:31 1004

原创 投入大模型是“血亏”还是“血赚”?2026终极答案与行动指南!

据全球知名市场分析机构IDC最新报告,到2026年,全球企业在生成式AI解决方案上的支出将超过1500亿美元,年复合增长率高达85%。然而,另一份由波士顿咨询集团发布的调研却显示,超过60%的AI投资项目未能达到预期的投资回报率。

2026-01-05 14:11:12 1056

原创 【万字长文】2026年大模型应用开发终极指南:掌握新时代核心技术竞争力!大模型学习路线

最近几年,大模型在技术领域的火热程度属于一骑绝尘遥遥领先,它已经深刻地影响了“编程”领域,且正在各个领域迅速渗透。与此同时,普通开发者也变得非常地焦虑,因为实实在在感受到了它强大的威力,担心哪天自己就被取代。与其担忧,我们不如主动拥抱这种技术变革

2026-01-05 14:08:34 1505

原创 23大开源AI智能体框架深度解析:从LangChain到AutoGPT,构建大模型应用全指南!

文章详细分析了23个主流开源智能体框架的技术特点、架构设计与应用场景。从LangChain的模块化链式调用,到LangGraph的状态化图结构执行,再到Dify、Coze等低代码平台,以及CrewAI、AutoGen等多智能体协作框架,全面展示了当前智能体技术的发展态势。文章指出,开源智能体框架已从功能验证进入产业落地阶段,未来随着MCP、A2A等协议普及,跨框架协作将成为新突破点,推动智能体技术从框架竞争迈向生态互联。

2026-01-05 14:04:40 1064

原创 Agent函数调用精度与稳定性提升指南:深入解析实现精准稳定调用的关键技巧与策略!

文章系统阐述了如何提升Agent系统中Function Call的准确率,指出工程化而非框架demo才是关键。通过量化指标、分析四大错误原因(Schema设计、Prompt歧义、采样策略、缺乏防御),提出动态路由、CoT+Plan-Execute、结果校验、记忆注入和日志驱动五大优化方法。结合实际案例,如动态路由使准确率提升25%,Plan-Execute使复杂任务成功率从62%提高到92%,展示了系统化解决方案的价值。这些方法源自真实项目实践,能帮助面试者展示完整的技术体系和思考方式。

2026-01-05 14:02:32 902

原创 【干货】强化学习入门必读:深入解析PPO与GRPO,轻松掌握其核心原理与技巧!

文章通过小学考试比喻,生动解释了强化学习奖励机制从单纯使用绝对分数(Reward)到引入Critic降低方差,加入Clip防止更新过度,使用Reference Model防止极端策略的演进过程。最后重点介绍了GRPO创新方法,它通过多次采样平均Reward作为基线,避免了单独价值网络训练,使大型语言模型训练更高效稳定,同时保持了PPO原有的稳定性和合规性。

2026-01-05 13:59:40 539

原创 2026年AI大模型转行攻略:零基础系统学习路径,高薪就业指南及详细路线图!

AI人才市场需求爆发,企业更看重实践能力而非学历。文章提供了系统学习路径:第一阶段掌握Python和机器学习基础;第二阶段深入学习机器学习算法;第三阶段突破深度学习,选择CV或NLP方向;第四阶段参与实战项目。同时强调通过开源项目、技术博客和持续学习构建就业竞争力,为不同背景的求职者提供公平发展机会。

2026-01-04 14:03:10 702

原创 400万人才缺口与月薪过万实习岗背后:2026年你最该关注的技术风口,没有之一!

腾讯阿里最新研究表明,小模型通过专用训练也能具备agent能力。小模型在专精、分布式和经济性方面优势明显,未来将是"大基座统领多小模型"的混合模式。开发者可从开源项目起步,构建高效、可扩展的混合Agent生态,实现性能与成本的平衡优化。

2026-01-04 14:02:00 1327

原创 小模型也能当“Agent“!腾讯阿里论文揭示AI开发新范式!

腾讯阿里最新研究表明,小模型通过专用训练也能具备agent能力。小模型在专精、分布式和经济性方面优势明显,未来将是"大基座统领多小模型"的混合模式。开发者可从开源项目起步,构建高效、可扩展的混合Agent生态,实现性能与成本的平衡优化。

2026-01-04 13:56:28 667

原创 【LLM的下半场】深入解析大模型Agent技术:未来趋势与实战干货!

文章探讨从Chatbot到Agent的技术范式转移,预训练将进入"存量精耕"阶段,后训练全面转向RL时代。蒸馏路径已断,必须构建自有RL基建。Agent将实现并行化、异步思考,带来极致用户体验。强调长期主义投入的重要性,技术决胜关键包括顶级算法设计、强悍Infra团队、云服务能力等。

2026-01-04 13:55:37 965

原创 【万字长文】从零开始构建高性能本地RAG系统:完整代码与优化指南!

文章详细介绍了如何从零开始构建本地生产级RAG系统,包括文档处理、嵌入生成、向量搜索和答案生成四大核心组件。使用FAISS、sentence-transformers和llama.cpp等开源工具,在消费级硬件上实现高性能检索增强生成。文章提供了完整的代码实现和优化指南,帮助读者理解RAG工作原理,并部署可扩展的本地知识库系统,适用于各类文档问答场景。

2026-01-04 13:53:19 1073

原创 大模型学习必备:提示词构建与结构化方法全面解析!

本文是一份全面的AI提示词工程指南,介绍了提示词的定义、结构化构建方法、实用技巧策略及避坑指南。提示词工程是短期内落地应用AI的关键技术,通过精心设计输入提示,可引导大模型生成更精准的输出。文章详细阐述了明确目标、提供上下文、设定格式等构建原则,并提供了丰富的案例库资源和学习路径,帮助读者从新手逐步成长为提示词工程专家。

2026-01-03 08:15:00 1435

原创 大模型与大模型产品区别指南:7大核心特性对比与应用解析!

本文详细对比了大模型技术与大模型产品的核心区别。大模型是底层技术能力,需通过API调用;大模型产品是可直接使用的商业化应用。文章分析了两者在记忆、上下文窗口、知识时效、幻觉、多模态及安全对齐等七个维度的差异,并介绍了大模型产品如何通过应用层技术(如RAG、函数调用等)弥补大模型的固有缺陷,为用户提供更安全、可靠的服务。

2026-01-03 08:00:00 902

原创 Transformer详解:注意力机制原理+PyTorch完整实现!

Transformer是一种革命性的序列处理模型,通过自注意力机制解决传统RNN的记忆衰减和计算效率问题。它采用编码器-解码器架构,结合多头注意力、残差连接和层归一化等技术,实现高效的并行计算和全局依赖捕捉。文章详细解释了Transformer的原理,包括QKV投影、注意力计算、多头注意力机制,并提供完整的PyTorch实现示例,展示了其在序列预测任务中的应用效果。

2026-01-02 08:00:00 743

原创 高效落地大模型应用:企业级AI知识库构建实战,解析18个关键踩坑点与解决方案!

文章详细介绍了企业级AI知识库的构建实践,分享了从技术选型到系统落地的全过程,重点解析了18个关键踩坑点及解决方案,包括环境配置、文档处理、工作流设计、知识库构建、测试验证和性能优化等方面。通过真实案例展示了AI知识库在提升效率、降低成本、改善服务质量等方面的显著价值,为企业落地AI知识库提供了实用指南。

2026-01-02 08:00:00 1045

原创 大模型微调秘籍:数据集准备与优化技巧!

在大模型微调中,数据集是决定模型效果的核心要素——再好的模型和工具,没有高质量数据集支撑,也无法适配垂直场景。本文结合2025年最新数据集资源、工具链更新,为大家系统梳理微调数据集的准备逻辑:从模型选型、数据类型选择,到格式规范、自定义数据集注册,全程贴合LLaMA Factory实操,新手也能快速上手!

2026-01-01 08:30:00 934

原创 Dify v1.11.2新版本发布即踩坑:9大严重问题深度解析与避坑指南!

文章分析了Dify v1.11.2版本发布后五天内出现的9个严重缺陷,涵盖性能、安全、功能稳定性和数据处理等多个领域。这些问题包括聊天消息加载异常、云服务执行时间不稳定、XSS安全漏洞、Agent节点配置错误等,严重影响开发者使用体验和工作效率。目前多数问题已被官方确认修复,但尚未发布正式修复版本,给开发者日常使用带来困扰。

2026-01-01 08:00:00 864

原创 想成为AI算法工程师,需要学些什么!

从ChatGPT到新近的GPT-4,GPT模型的发展表明,AI正在向着“类⼈化”⽅向迅速发展。GPT-4具备深度阅读和识图能⼒,能够出⾊地通过专业考试并完成复杂指令,向⼈类引以为傲的“创造⼒”发起挑战。现有的就业结构即将发⽣重⼤变化,社会⽣产⼒的快速提升将催⽣新的⾏业和岗位机会。如何与⼈⼯智能协同⼯作,利⽤AI辅助办公已经成为各⾏从业者的必修课。

2025-12-31 09:30:00 1158

原创 Java工程师的AI Agent开发之路:Spring AI Alibaba实战指南!

本文介绍了AI Agent的概念、开发现状及Java开发技术栈。AI Agent是基于大模型的软件代理,解决了大模型无记忆、知识有限和无法调用外部资源的问题,通过session管理、RAG技术和Function Call等技术增强能力。虽然Python是Agent开发主流语言,但Java凭借其庞大生态和Spring AI/Spring AI Alibaba框架正逐渐成为重要开发语言。Spring AI Alibaba作为阿里升级版框架,对国内开发者更为友好,提供了完整的中文文档和社区支持。

2025-12-31 09:30:00 1320 1

原创 大模型微调完整攻略:从数据准备到部署上线+LoRA参数高效微调原理详解!

文章详细介绍了大模型微调的完整流程,包括明确目标与数据准备、数据预处理、模型加载与参数设置、超参数配置、训练验证、评估优化及部署。特别阐述了参数高效微调方法LoRA的原理,通过小维度向量运算改变模型输出质量。文章基于ChatGLM-6B和Qwen2.5-7B模型实战经验,梳理了适用于大模型微调的一般性流程和技巧。

2025-12-31 09:15:00 739

原创 告别繁琐,vLLM工具带你进入无痛AI应用新时代!

vLLM Playground是一个界面化的vLLM工具,解决了大模型部署门槛高的问题。它提供零配置启动,自动管理容器环境,支持本地和云端部署;集成了17+个主流模型的现成配置,无需手动调试参数;内置性能测试功能,可监控关键指标。安装简单,支持GPU/CPU模式,企业级部署也得到支持。该工具将复杂的vLLM配置和部署过程简化为直观的界面操作,让团队专注于业务开发而非环境搭建。

2025-12-31 09:00:00 715

原创 探索LLM的奥秘:语言模型是否拥有思维?AI哲学中的深度思考!

文章从维特根斯坦哲学出发,分析LLM作为预测引擎的工作机制,结合中文房间思想实验,指出LLM虽能模拟思想功能但缺乏主观体验和真实理解,本质是信息处理系统而非思想主体。同时提供大模型AI系统学习资源,包括四个阶段:初阶应用、高阶应用、模型训练和商业闭环,从基础到实战帮助读者掌握大模型技术,提升职场竞争力。

2025-12-31 08:45:00 920

原创 AI PM上岸|和ai产品经理和传统PM的区别到底在哪?

文章阐述了AI产品经理与传统产品经理的三大核心区别:首先是工作重心从设计功能转向对抗模型幻觉,应对AI输出的不确定性;其次是用户旅程设计从界面交互转变为对话流和Agent构建;最后是商业策略必须前置,因为AI调用存在实际成本,需从第一天就考虑变现问题。这些转变要求产品经理更新思维模式,适应AI时代的产品开发逻辑。

2025-12-30 11:33:06 537

原创 终于把LLaMA 2跑起来了,然后呢?本地大模型部署的残酷真相!

文章揭示了本地部署大模型热潮背后的真相:调查显示70%的用户在部署后3个月内放弃使用。文章从技术门槛、成本黑洞、体验落差、需求虚化和生态短板五个维度分析了本地部署大模型的困境:技术维护复杂、硬件成本高、输出质量差、实际应用场景少、工具链混乱。作者指出,本地部署更适合技术极客,普通用户应关注"轻量化本地AI"发展,选择真正适合自己的AI工具,而非被"技术焦虑"绑架。

2025-12-30 11:31:04 1043

原创 【万字长文】大模型架构演进全解析:从GPT-4到智能体时代的三大技术支柱!

文章总结了自2023年GPT-4发布以来,大模型领域从单一追求规模转向由三大新支柱构成的多维发展策略:1)效率,通过稀疏化(MoE)和先进注意力机制实现;2)推理,通过重新分配计算资源和先进强化学习技术;3)智能体,作为推理能力的应用,使模型能自主使用工具与数字乃至物理世界交互。这一转变将大模型从复杂文本预测器转变为初具形态的通用问题解决系统。

2025-12-30 11:29:22 680

原创 掌握LangChain:从入门到精通,打造下一代AI应用的终极指南!

LangChain是构建大模型应用的开源框架,解决语言模型的静态性、孤立性等问题。其核心模块包括Models、Prompts、Chains、Memory、Indexes和Agents,提供模块化设计、多模型支持和数据整合能力。适用于智能问答、对话机器人、文档分析等场景,为开发者提供高效构建AI应用的完整工具链,降低开发门槛,简化开发流程。

2025-12-30 11:19:12 589

原创 2026校招热点:AI大模型工程师薪资揭秘,数学能力成新货币,抓住机遇正当时!

本文指出2026届校招市场AI人才需求呈现"需求稳增、结构优化、薪酬分化"特征。高科技企业成为AI人才需求主力军,技术研发类岗位需求旺盛。企业招聘标准发生变革,数学与算法基础、实际项目经验成为核心评估指标,名校学历重要性下降。大模型算法工程师月薪中位数近2.5万,领跑校招市场,凸显行业对高端技术人才的重视。具备扎实算法基础和项目经验的AI人才将成最大赢家。

2025-12-30 08:45:00 2018

原创 非科班零代码,如何杀入AI大模型赛道?给普通人的一份“破局路径”实操指南!

在商业发展的规律中,几乎所有行业都会历经三个关键阶段:以技术突破为核心的探索期、以产品打磨为重点的成长期,以及以精细化运营驱动增长的成熟期。如今,人工智能领域正完成从“重技术”到“重产品”的关键跨越——第一轮AI技术变革的浪潮逐渐平息,大模型、机器学习等核心技术走向成熟,AI不再是实验室里的概念,而是开始深度渗透到金融、医疗、教育、制造等各行各业,落地为实实在在的产品。随之而来的,是AI产品经理这一岗位的爆发式增长,其薪资水平与市场需求双双创下新高,成为职场中炙手可热的“新风口”。

2025-12-29 09:00:00 1405

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除