- 博客(1265)
- 收藏
- 关注
原创 算法岗:2026年程序员涨薪的最后一张王牌?拆解大模型人才稀缺的逻辑与路径
9月16日,脉脉最新发布的《2025年AI人才流动报告》(以下简称报告)显示,2025年1—7月,AI领域人才市场供需两旺,AI新发岗位量同比增长超10倍,简历投递量也暴涨了11倍。“算法”相关人才持续紧缺,其中“搜索算法”人才紧缺度最高,5岗争2人。非技术岗数量同比增长7.7倍。
2026-01-26 09:15:00
1290
1
原创 想转行AI大模型?这可能是全网最值得跟的4门免费公开课(附学习顺序与路线)
本文推荐4门大模型优质学习资源:清华大学与OpenBMB合作的系统课程(适合零基础)、斯坦福CS224n经典NLP课程、哈佛Transformer代码实践课程,以及Hugging Face库教程。这些课程覆盖从基础理论到前沿技术再到实际应用的全方位内容,帮助不同基础的读者系统学习大模型知识,快速入门这一热门领域。
2026-01-26 09:15:00
405
原创 【大模型入门必看】从零理解Transformer:大模型如何精准关联上下文(建议收藏)
文章核心是解释大模型中的Transformer架构,特别是注意力机制如何使模型能像人类一样"划重点"。通过Query-Key-Value计算词间相关性,动态分配权重,建立逻辑网。文章还分析了长文本处理中的"Lost in the Middle"问题及优化策略,如精简Context、位置策略和多步推理,帮助开发者理解并解决大模型应用中的实际问题。
2026-01-26 09:00:00
310
原创 【万字长文】LLMs高效推理技术详解:数据级、模型级和系统级优化全攻略!
本文系统介绍了大语言模型高效推理的关键技术,分析了推理过程中的计算成本、内存访问成本和内存使用等挑战,并从数据级、模型级和系统级三个维度详细阐述了优化方法。数据级优化包括输入压缩和输出组织;模型级优化涵盖高效结构设计、量化、稀疏化、知识蒸馏等技术;系统级优化则聚焦推理引擎和服务系统优化,共同构成了提升LLMs在资源受限场景下推理效率的完整解决方案。
2026-01-26 09:00:00
832
原创 【珍藏干货】大模型RAG技术演进:从传统检索到GraphRAG的实战指南!
文章对比分析了RAG、GraphRAG和本体方法在大模型检索增强技术中的特点与应用场景。GraphRAG通过引入知识图谱解决了传统RAG在复杂推理中的局限性,实现了从"文本召回"到"结构化证据链召回"的升级。文章提出了基于"任务复杂度×关系依赖度×合规强度×时效要求"的四象限选型策略,建议采用"轻量本体先行+GraphRAG增量生长+HybridRAG控时延"的混合方法作为最优解决方案。
2026-01-26 08:45:00
1010
原创 AI Agent全解析:从零开始构建你的智能体(概念、核心能力及设计范式)
文章介绍了AI Agent的概念、核心能力及设计范式。AI Agent是能主动规划、执行任务的智能系统,具备规划、记忆和工具使用能力。文章详细分析了三种设计范式:反应式(快速决策)、深思熟虑式(战略规划)和混合式(结合两者)。构建Agent时应注意:仅用于复杂高价值任务、保持简洁设计、模拟Agent思维发现设计缺陷。AI Agent与工作流互补,能增强自动化、可扩展性和适应性,适合在智能制造等复杂场景应用。
2026-01-25 09:00:00
1149
1
原创 Skills与MCP的区别:大模型Agent工程化的关键一步!
Skills不是替代MCP,而是解决MCP无法覆盖的问题。它将"完成一类事情的经验"从模型自由推理中抽离,显式固定下来,使Agent行为更稳定、流程更易复用、成本更可控。Skills决定"该怎么做",MCP决定"怎么安全地做"。Skills是Agent走向工程化的关键一步,让Agent的做事方式可沉淀、可复用、可治理,是LLM灵活推理与传统软件稳定流程间的理想中间态。
2026-01-25 08:45:00
706
原创 大语言模型(LLM)面试50问精解:从基础到进阶,掌握AI领域核心逻辑,成为AI高手的必备指南!
本文整合了50道大语言模型(LLM)核心面试题及深度解析,既覆盖基础原理与技术细节,也包含前沿应用与行业挑战,为AI领域求职者、研究者及爱好者搭建系统的知识框架,助力快速掌握LLM面试重点与核心逻辑。
2026-01-24 09:15:00
851
原创 大模型训练算法演进:从DPO到GRPO/DAPO/GSPO/SAPO,一文读懂所有改进!
本文详细介绍了DPO之后大模型训练算法的发展路线,包括GRPO、DAPO、GSPO和SAPO四种算法。GRPO采用组采样方式降低显存占用;DAPO引入归一化系数、非对称裁剪等改进提升训练效率;GSPO改变重要性采样方式,适用于MoE模型;SAPO采用token级软信任区域和非对称温度设计。这些算法在PPO基础上不断优化,使大模型训练更高效稳定。
2026-01-24 09:00:00
1458
原创 2026年AI时代揭秘:哪个岗位最吃香?AI产品经理薪资大揭秘,今年工资竟然这么高!
AI产品经理成为当前最热门岗位,大厂高薪招聘需求激增。随着AI技术爆发式发展,各行业都在加速AI化转型,导致AI产品人才严重供不应求。数据显示,2025年AI岗位同比增长543%,AI产品经理薪资较普通产品岗高出20%。不仅技术岗位需要AI能力转型,基础岗位员工也迎来发展机遇。为帮助从业者快速掌握AI技能,特别整理包含学习路线、实战案例、面试真题等全套资料包免费分享。抓住AI红利期,实现职业跃迁正当时。
2026-01-24 09:00:00
654
原创 揭秘!产品经理与AI产品经理:区别大解析,你真的了解吗?
文章对比了经典产品经理与智能产品经理在服务对象、能力体系、协作部门、工作重心、工作流程和数据分析视角等方面的差异。经典产品经理面向C端用户,注重用户体验和商业变现;智能产品经理聚焦B端市场,深耕行业,关注技术落地和效率提升。两条职业路径无优劣之分,关键在于个人特质与职业目标的匹配。
2026-01-24 08:45:00
1379
原创 这个神仙平台让你免费玩转GPT-5.2、Gemini 3 Pro等15种顶级大模型!
LMArena是一个由伯克利博士生创建的大模型评测和体验平台,已估值17亿美元成为独角兽。平台采用"真人偏好"评测方式,通过600万次投票形成权威排名。用户可免费体验15种顶级文本模型和多种图像、视频模型。大厂如OpenAI、谷歌等常在此秘密测试新模型。平台提供多种使用模式,虽有一些限制,但对想免费体验各种大模型的用户极具价值。
2026-01-24 08:45:00
821
原创 企业AI转型宝典:四步掌握“人工智能+”,引领高质量数字化转型新潮流!
企业实施"人工智能+“需满足基础条件,将AI认知从工具视角升维到生态视角。四步法实现转型:精准切入高价值场景、选择合适AI杠杆、践行敏捷迭代、打造AI原生能力(数据治理、人才建设、组织变革)。避开期望过高、数据陷阱、技术而非业务驱动、忽视变革管理等四个"坑”。通过AI赋能实现企业从经验驱动转向数据驱动,推动高质量数字化转型。
2026-01-23 09:15:00
1500
原创 2026年AI大模型岗位转型指南:普通人如何把握技术原理,洞悉薪资前景,锁定6大黄金方向!
在数字化转型加速推进的当下,人工智能(AI)技术正以前所未有的速度重塑各行各业,而AI大模型作为其中的核心引擎,无疑成为了科技领域最炙手可热的方向。对于渴望提升职业竞争力、改善经济状况的普通人而言,这场由大模型引领的技术革命,不仅是时代赋予的挑战,更是一次实现职业跨越的绝佳契机。
2026-01-23 09:15:00
990
1
原创 Agent与Workflow融合之道—构建大模型业务落地的完整指南!
本文深入探讨Agent与Workflow如何协同构建Agentic系统,实现大模型与业务场景的有效连接。文章分析了二者本质差异,系统介绍了多种工作流构建范式及其适用场景,包括增强型LLM、提示词链接、路由、并行处理等,并详细解析了N8N、Dify与Coze三大开源框架的特点与应用价值,为开发者提供了构建高效、稳定且可工程化落地的Agentic系统完整指南。
2026-01-23 09:00:00
613
原创 阿里巴巴DASD新范式:小模型+少数据碾压32B大模型,长思维链推理开源指南!
阿里巴巴提出的分布对齐序列蒸馏(DASD)通过温度调度学习、差异感知采样和混合策略蒸馏三大创新,解决了传统蒸馏方法的痛点。该方法打造的DASD-4B-Thinking仅用448K样本就在数学推理、代码生成和科学问答三大任务上超越所有同规模模型,碾压多个32B级大模型。模型权重和训练数据集已全量开源,为开发者提供了高效训练轻量级推理模型的新方法。
2026-01-23 08:45:00
1623
原创 RAG检索系统优化实战:从向量检索到混合检索+重排序的进阶之路!
文章指出RAG应用中单一向量检索的局限性,包括专有名词匹配失败和语义漂移问题。解决方案是采用分层过滤机制:第一层通过混合检索(向量+BM25)利用RRF算法最大化召回率;第二层引入Cross-Encoder重排序模型对候选文档精准评分,提高精确度。这种架构特别适用于法律、医疗等术语密集领域,是构建高可用RAG系统的核心策略。
2026-01-23 08:45:00
1040
原创 (2026年)AI浪潮下的职业新机遇:大厂疯抢AI人才,AI产品经理起薪30K
文章介绍了AI产品经理这一热门职业的前景与薪资优势,指出即使没有技术背景也能转型为AI应用型产品经理,这类岗位主要关注AI商业化落地,要求具备行业场景洞察和需求拆解能力。文章针对不同背景人士提供了转型策略,并推荐参加产品经理私教陪跑实战营,通过系统学习产品知识、积累AI项目经验,帮助求职者实现职业转型,提升薪资水平。
2026-01-22 09:15:00
1225
原创 2026年大厂招聘新趋势:【Java+大模型】工程师薪资天花板再破新高,抓住职业新机遇!
最近在技术圈,一位拿到华为Offer的Java开发工程师分享了他的经历:面试官几乎没问传统SSH框架问题,而是聚焦于大模型应用开发和AI工具链整合能力。最终他拿到的薪资包比同组普通Java开发高出近200%。
2026-01-22 09:15:00
906
原创 2026年重塑LLM的“第二大脑”:RAG技术原理与核心价值深度解析!
RAG技术通过结合预训练大模型与外部知识检索系统,有效解决了LLM的幻觉、知识时效性和私有数据访问三大痛点。其核心流程包括索引构建、相关检索和答案生成三个阶段,显著提升准确性、实时性和数据安全性。相比微调,RAG更适合动态响应和频繁更新的场景,而高级形态如GraphRAG和Agentic RAG正推动技术向更复杂推理方向发展。RAG标志着大模型从"记忆者"到"思考者"的架构革命。
2026-01-22 09:00:00
927
原创 Ollama+ClaudeCode:本地大模型编程新方案,小白也能轻松上手!
Ollama最新支持接入Anthropic API,使本地模型可接入ClaudeCode进行编程。通过简单配置环境变量或使用CCSwitch工具,开发者可轻松设置Ollama与ClaudeCode的连接,推荐使用gpt-oss:20b模型。文章同时指出,对于电脑配置不足的用户,建议接入云服务厂商的模型如MiniMax M2.1、GLM-4.7等,并推荐智谱的编程套餐作为轻量级开发解决方案。
2026-01-22 08:45:00
1257
原创 大模型产品架构全景解读:从应用场景到技术支持的完整路径!
Ollama最新支持接入Anthropic API,使本地模型可接入ClaudeCode进行编程。通过简单配置环境变量或使用CCSwitch工具,开发者可轻松设置Ollama与ClaudeCode的连接,推荐使用gpt-oss:20b模型。文章同时指出,对于电脑配置不足的用户,建议接入云服务厂商的模型如MiniMax M2.1、GLM-4.7等,并推荐智谱的编程套餐作为轻量级开发解决方案。
2026-01-22 08:45:00
1208
原创 【AI Infra首面】2026年从技术复盘到实习决策的全方位指南!
文章作者分享参加AI Infra岗位面试的经历,详细介绍了面试中对FlashAttention、vLLM PagedAttention等技术点的考察,以及开源贡献的重要性。面临实习与继续学习的抉择,最终选择实习以丰富简历,同时保持每天3小时学习。强调了实战经验对大模型求职的关键作用,以及如何在实习与学习间找到平衡,为想进入大模型领域的程序员提供了宝贵参考。
2026-01-21 09:29:34
775
原创 (2026最新版)转行AI产品经理:没有经验,也能轻松入门并实现职业转型!——零基础入门到高薪就业的实战路径
《AI时代产品经理转型指南》 在AI技术重塑行业的背景下,产品经理岗位要求正发生重大变化。本文系统梳理了AI产品经理的核心能力模型:1)技术理解力:掌握AI基础概念(如LLM、Transformer)及原型设计工具;2)复合技能:业务指标分析、市场研究等传统能力与沟通叙事等软技能结合;3)实践经验:通过实习、创业项目或产品拆解积累全流程经验。文章特别强调,AI产品经理需在用户与技术团队间建立新型桥梁,无需精通算法但必须理解技术逻辑。文末指出AI人才缺口达400万,并提供全套免费学习资源包(含教程、面经、技术
2026-01-21 09:29:24
885
原创 企业级AI Agent核心技术全解析:架构、安全与运维实践!
文章系统阐述了企业级AI Agent的技术实现路径,从核心技术原理(单体到多智能体架构演进)到四层系统架构设计,再到工程化实现、安全可信保障、云原生部署及典型场景落地。强调企业AI Agent应作为新生产力单元,可靠理解、可控执行、持续进化,建议从业务价值出发构建小闭环,避免技术堆砌,确保系统可审计、可回滚、可灰度。
2026-01-21 09:29:16
834
原创 【万字长文】Anthropic深度解析:AI Agents评估全攻略,助你构建更可靠的智能系统!
本文详细介绍了Anthropic团队关于AI Agents评估的完整指南,强调评估对智能体开发的重要性。内容涵盖评估结构、不同类型评分器、针对各类智能体的评估方法、处理非确定性的指标(pass@k和pass^k),以及从零开始的评估路线图。文章提出自动化评估应与生产监控、用户反馈等方法结合,形成多层防护机制,帮助开发者在问题影响用户前发现并解决,最终构建更可靠的AI智能体系统。
2026-01-21 09:28:59
834
原创 【大模型必学】RoPE旋转位置编码详解:从基础到进阶,一篇搞定位置编码!
旋转位置编码RoPE(Rotary Position Embedding)是一种Transformer模型中的位置编码策略,它广泛应用于LLama,ChatGLM等大模型,本篇先介绍RoPE的实现步骤和源码,再深入讲解RoPE涉及到的数学原理,力求做到从易到难,学习曲线平滑。
2026-01-21 09:19:24
777
原创 2026年!程序员转行做AI产品经理:系统化学习路径与实战经验分享!
秋招进入尾声,想转岗/跳槽的产品友友们拿到心仪的offer了么?随着就业竞争压力逐年提升,不少社交社区平台也成了产品人求职通道,一位产品朋友在脉脉大吐苦水
2026-01-20 09:15:00
1250
原创 2026年程序员转行指南:如何成功转入AI大模型领域?大模型应用工程师揭秘角色定位与未来前景!
随着人工智能技术的飞速发展,大模型已成为当今科技领域的核心驱动力。在这一浪潮下,大模型应用工程师这一新兴职业崭露头角,备受瞩目。那么,究竟什么是大模型应用工程师?他们的就业前景如何?薪资待遇怎样?又该如何规划自己的职业发展道路?接下来,让我们一同深入探讨。
2026-01-20 09:15:00
2100
原创 2026年AI将迎来巨变,测试开发人员必须掌握的AI测试技能!
AI正从智能工具进化为可独立执行任务的软件系统(Agent),已对软件测试领域产生冲击。测试职责正从验证功能转向约束系统行为边界,测试开发人员必须系统补齐AI能力,包括评估大模型稳定性、识别系统风险等。未来,不会AI测试的测试开发将逐步退出核心系统,掌握AI测试技能已成为测试开发人员的必备能力。
2026-01-20 09:00:00
467
原创 【2万字长文】一文掌握大模型注意力机制:MHA、MQA、GQA、MLA、NSA、SSA、MoBA详解!
本文系统梳理了注意力机制的发展历程,重点解析了MHA、MQA、GQA等典型算法的原理与优缺点。自Transformer提出以来,注意力机制经历了从增强表达能力(MHA)、优化计算效率(MQA/GQA)到稀疏化处理长序列(NSA/MoBA)的演进过程。文章通过"多人多角度阅读"等通俗案例,生动阐释了多头注意力机制的工作原理,并指出计算效率与模型表达能力的平衡是持续优化的核心方向。随着大模型应用场景的扩展,注意力机制在长序列处理、推理加速等方面仍面临挑战,值得进一步探索创新解决方案。
2026-01-20 08:45:00
1941
原创 MCP协议让AI从“聊天“到“动手“,附2026年AI大模型开发全攻略!
MCP是Anthropic推出的模型上下文协议,旨在解决大模型与外部工具的安全高效连接问题,具有统一标准、双向通信、上下文理解、可拓展性和内置安全机制五大优势。文章详细介绍了AI大模型应用开发的学习路线,包括大模型基础认知、核心技术模块、开发基础能力、应用场景开发、项目落地流程和面试求职冲刺六大模块,为AI学习者提供了从入门到就业的全面指导。
2026-01-20 08:45:00
1617
原创 别只盯着模型调参!2026数据分析师AI转型四大黄金赛道(附最全指南,薪资翻倍就靠它)
后台收到一条特别有代表性的留言,来自一位深耕数据分析领域2年的朋友:“每天和数据报表、可视化打交道,最近被AI大模型的能力震撼到了,想转型但完全没方向,不知道自己的技能能对接哪些AI岗位?”
2026-01-19 15:26:42
1508
原创 AI产品经理:未来5年最具“钱“景的程序员转型指南!(2026最新版)
AI产品经理是未来5年最具前景的高薪职业。文章指出想进入AI领域的人常分为观望者、探索者和跑偏者三类,并介绍了AI产品经理的三个层次。成为应用型AI产品经理需夯实产品基本功、掌握AI项目落地能力和补充AI知识技能。
2026-01-19 09:15:00
1193
原创 大模型的“信息管家“:一文读懂上下文工程(Context Engineering)
就像顶级厨师需要新鲜食材才能做出好菜,大模型的表现也完全由输入的上下文信息决定。而如何系统性地设计、优化这些"信息料包",已经形成了一门专门的学问——上下文工程(Context Engineering)。
2026-01-19 09:00:00
897
原创 大模型开发全流程指南:从基础概念到模型部署,构建AI大模型的完整技术路线!
本文系统介绍大模型开发全流程,从基础概念(AI、模型、Transformer、Token)到数据工程(算力集群、数据清洗)、预训练(自监督学习)、指令微调(SFT和RLHF),最后到模型评估与部署。文章详细展示了从原始数据到可用大模型的完整构建过程,为理解大模型开发提供了系统化技术框架。
2026-01-19 09:00:00
1309
原创 大模型搜索Agent核心技术:4种Agent架构介绍及Planner架构!
文章介绍了深度搜索Agent的几种主流架构,从基础迭代式到Planner-Only、双模块再到递归式设计。详细讨论了如何合理拆分复杂问题、评估搜索结果充分性的技术方案,包括停止条件处理、澄清机制和检查清单评分等方法。不同架构各有优劣,实际应用中可从简单架构逐步叠加模块,根据需求选择合适方案。
2026-01-19 08:45:00
522
原创 【强烈推荐】MiniMind:用25.8M参数和3元成本,零门槛打造你的大语言模型(必学收藏)
当大语言模型还在比拼千亿参数、百亿算力时,一个反其道而行之的项目悄然走红——MiniMind用25.8M参数(仅为GPT-3的1/7000)、3元服务器成本和2小时训练时间,实现了从0到1构建可对话的语言模型。这个完全开源的项目,正在重新定义普通人接触大模型的门槛。
2026-01-18 09:30:00
1466
原创 【干货收藏】多智能体协作(MAS)实战指南:解决复杂任务的关键技术
本文探讨了多智能体协作(MAS)如何突破单一AI的局限性。MAS通过"角色分工+任务管理+通信交互"三层协作体系,让多个专业智能体形成闭环,有效解决幻觉生成、专业知识不足和跨任务协同断裂等问题。文章详细介绍了MAS的技术原理、主流框架(CrewAI与Google ADK)及核心协议(A2A),分析了产业挑战与未来趋势,指出MAS是AI从"个体能力驱动"向"机制设计驱动"转变的关键范式。
2026-01-18 08:45:00
1842
原创 别被 “一键部署” 骗了!使用Ollama本地部署DeepSeek 避坑指南
最近最火的莫过于DeepSeek,现在网上关于 AI 模型部署的文章一抓一大把,动不动就是 “一键部署,轻松上手”、“30 分钟搭好一个本地能跑起来的大模型”。可现实是,当你真上手用 Ollama 搭建 DeepSeek 模型时,那简直就是踩坑大冒险!今天咱就来好好唠唠那些坑,帮你顺利搭建属于自己的 DeepSeek。
2026-01-17 09:15:00
1518
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅