自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2600)
  • 收藏
  • 关注

原创 揭秘大模型概念与应用:探讨其在不同场景下的落地实践

大模型是什么?大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。大模型是指模型具有庞大的参数规模和复杂程度的机器学习模型。在深度学习领域,大模型通常是指具有数百万到数十亿参数的神经网络模型。这些模型需要大量的计算资源和存储空间来训练和存储,并且往往需要进行分布式计算和特殊的硬件加速技术。大模型的设计和训练旨在提供更强大、更准确的模型性能,以应对更复杂、更庞大的数据集或任务。

2024-08-28 11:26:39 1560 1

原创 医疗与大模型:重塑未来医疗生态的营销之道

医疗与大模型的结合正成为行业发展的重要趋势。面对这一机遇和挑战并存的局面,我们应积极拥抱变革、勇于创新实践。通过精准定位、打造案例、拓展合作和创新模式等多种手段相结合的方式,共同推动医疗大模型在行业的广泛应用和普及发展。那么,我们该如何学习大模型?作为一名热心肠的互联网老兵,我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

2024-06-13 13:38:20 2891 1

原创 AI失业雷达图曝光!你的工作还能撑多久?程序员、客服首当其冲,30%职业受影响为零!

AI失业雷达图揭示职业替代趋势:程序员、客服等高重复性信息处理岗位面临74%和70%的高替代率,因AI擅长结构化语言交互;而厨师、维修工等需物理操作和多感官判断的低收入职业暂未受影响。报告警示职场人需转向直接创造收入的角色,同时指出大模型时代催生"技术+业务"复合型人才的新机遇,建议把握提示词工程、RAG、模型微调等关键技术,在Agent元年(2025)前建立竞争优势。(149字)

2026-06-25 20:08:24 189

原创 一文读懂大语言模型,普通人也能看懂的AI全景图

大语言模型(LLM)简明指南:原理、应用与未来趋势 核心原理 大语言模型(如ChatGPT)通过海量文本预训练(如整个互联网数据)学习语言规律,利用Transformer架构的注意力机制(多头Attention)理解上下文关联。训练分为预训练和人类反馈调优(RLHF)两阶段,使其具备流畅对话与任务处理能力。 技术基础 Transformer:核心架构,通过QKV(Query-Key-Value)机制计算词关联性,多头注意力实现多维度语义理解(如语法、时间、动作)。 算力需求:训练需数千张GPU(如NVIDI

2026-06-25 19:55:06 11

原创 一文带你了解目前热门的AI就业岗位需要具备的能力以及薪资范围

本文介绍了大模型时代7类热门AI岗位的工作内容及薪资范围,包括大模型算法工程师、AI应用开发工程师、AI产品经理等,指出这些岗位普遍年薪30-200万不等,其中AI基础设施工程师供需比低至0.15。文章强调大模型正推动职业价值重塑,催生大量"技术+业务"复合型人才需求,并预测2025年为Agent元年。最后推荐了大模型应用学习路线,包含提示词工程、RAG、微调、部署等核心技术模块,提供104G学习资源包助力入门。

2026-06-25 16:35:46 37

原创 龙虾智能体和codex、claude code有什么区别?

本文摘要: AI智能体根据应用场景可分为三类:通用个人智能体(如龙虾智能体)擅长处理日常事务和工具串联;软件工程智能体(如Codex、Claude Code)专注于代码工程任务;办公交付型智能体(如WorkBuddy)则聚焦文档材料生成。选择时应根据需求场景:日常事务选个人助理,代码开发选工程助手,文档处理选办公工具。三类工具可组合使用,关键区别在于工具连接对象、修改内容和输出形式。(149字)

2026-06-23 16:57:18 145

原创 AI Agent工程:从Prompt到Loop,构建自主智能体的完整指南

AI Agent工程概念解析:从Prompt到Loop的演进 本文梳理了AI Agent领域涌现的各类"Engineering"概念(Prompt/Context/Harness/Loop Engineering),指出它们并非层级关系而是抽象程度的演进。Prompt Engineering聚焦单次调用的输入优化;Context Engineering解决信息选择与组织问题;Harness Engineering设计多Agent协作架构;Loop Engineering构建自迭代系统。文章通过具体案例和权威

2026-06-23 16:56:11 217

原创 Loop工程:让AI持续迭代,揭秘AI自动闭环的“黑科技”!

摘要: Loop Engineering(循环工程)是一种将AI Agent的多次执行组织成自动闭环的技术,由程序决定下一步任务、验证结果及停止条件。其核心在于预判Agent可能的问题(如遗忘、跑偏),并设计相应处理规则。一个完整Loop包含触发机制、任务发现、状态存储、Agent执行、验证器、迭代策略、停止条件和预算控制八大要素。尽管循环思想并非全新,但随着AI能力的提升,Loop Engineering将自动化流程的决策部分交给Agent,使任务迭代更智能。典型应用场景包括CI/CD自动修复、PR审查等

2026-06-23 16:54:52 187

原创 AI产业的七层架构,你在几层(AI产业链视角)?

AI应用开发并非简单的API调用,而是由七层工程体系构成的复杂系统:1. 基础设施层(芯片/算力)提供基础支撑;2. 数据层决定模型质量;3. 算法框架层影响训练效率;4. 模型层选择需平衡性能与成本;5. 能力层实现具体功能;6. 平台层保障系统稳定;7. 应用层直接创造用户价值。 AI大模型应用开发工程师作为技术落地的关键角色,负责将大模型能力转化为实际产品,核心工作包括需求分析、技术选型、应用开发、测试优化及部署运维。该岗位市场需求旺盛,月薪最高可达60k,是连接技术与商业价值的重要桥梁。 (字数:1

2026-06-23 16:53:41 948

原创 AI大模型CUDA详解(原理+架构+流程)

CUDA(Compute Unified Device Architecture)是 NVIDIA 官方网站 推出的并行计算平台、和编程模型。CUDA,也常被译为“统一计算设备架构”。它是 NVIDIA 专有的并行计算平台和编程模型,主要用于让开发者利用 NVIDIA GPU 做通用计算,而不只是图形渲染。它的核心目标很明确:让开发者能够直接利用 GPU 的大规模并行能力,加速科学计算、图像处理、深度学习、数据分析等任务。简单理解:CUDA = 让程序员能够直接使用 GPU 进行通用计算的技术。

2026-06-22 16:34:24 157

原创 手把手教你用Python打造最小Agent,秒懂LLM+Tools+Loop核心逻辑!

工具不是函数本身,而是给模型看的"能力说明书":工具叫什么、能做什么、需要哪些参数。import reimport anthropicclient = anthropic.Anthropic()tools = [{ "name": "calculator", "description": "计算简单数学表达式,只支持数字、加减乘除和括号。

2026-06-22 16:33:33 205

原创 万字长文讲透Transformer:20个核心概念全解析

你每天都在用豆包、千问、 ChatGPT,但大概率还不知道:为什么它能“听懂”你说的话,甚至还能写代码、做分析、帮你思考,答案不是参数多,也不是算力强,真正决定这一切的,是它背后的底层架构——Transformer。可以这么说:没有 Transformer,就没有今天的大模型时代。它是 ChatGPT、Claude、Gemini、DeepSeek 这些模型共同的技术底座,也是这一轮 AI 爆发最核心的发动机,如果你看不懂 Transformer,你对大模型的理解,大概率还停留在表面。这篇文章,不讲复杂公式,

2026-06-22 16:32:43 215

原创 本科应届生拿到大厂+央企+小厂大模型AI产品经理offer

26届本科校招,拿了一堆offer🎉有大厂、有央企、有小厂,还有一个接一个在路上。恭喜上岸,目前最满意的是央企,总包29.25w。其他offer也即将拿下了!我给的建议是:不可能只待在一家企业。想拼发展,去大厂;想要稳定去央企——但什么是真正的稳定?长期的稳定,是能力的稳定。哪怕任何时候被裁员,也有立刻跳槽去优秀企业的底气。选央企,还是选大厂?如果是你,你会怎么选?另外,最近我也发现大家在面试中遇到的问题。Agent 和 AI Coding 相关的问题,出现频率最高。

2026-06-22 16:31:26 154

原创 阿里国际agent开发岗,我跪了!!!

摘要 本文记录了阿里国际Agent开发岗面试中的技术问题与回答,涵盖LangChain与LangGraph的区别、RAG原理与Embedding模型选择、上下文压缩方法、失败重试机制设计等。面试者分享了在LangGraph状态管理、多Agent协作、RAG优化等实践中的踩坑经验,并讨论了Transformer原理、IM系统消息可靠性保证等基础问题。整体展现了AI Agent开发中的技术权衡与实践思考,尤其强调了根据业务场景选择合适方案的重要性。

2026-06-18 17:51:53 528

原创 AI Agent开发必看:工具调用与Function Calling深度解析,轻松拿下大厂面试!

《AI Agent工具调用与Function Calling详解》 本文深入剖析AI Agent中工具调用和Function Calling的核心概念。首先阐明Agent必须调用工具的原因:大模型虽擅长语言处理,但缺乏实时信息获取和外部系统操作能力,需通过工具扩展其能力边界。工具调用主要解决四大问题:知识实时性不足、无法操作系统、精确计算不可靠及上下文限制。 Function Calling作为工具调用的工程实现,其工作机制包含六个步骤:定义工具、用户请求、模型生成调用指令、执行工具、返回结果及生成最终回答

2026-06-18 17:50:27 155

原创 AI编程进入新纪元:从Prompt到Loop再到Harness,未来开发者将如何定义?

最近几天,AI 圈最火的话题,不是 Claude Code,也不是 Codex。Claude Code 之父 Boris Cherny 公开表示:我已经不怎么直接提示 Claude 了,我在写 Loops。随后 OpenAI 的 Peter Steinberger(龙虾之父)也公开表示:你不应该给 Agent 写 Prompt,而应该设计让 Agent 自己写 Prompt 的循环系统。它只是 AI 编程进化过程中的一个中间阶段。真正的变化,其实比这大得多。

2026-06-17 16:35:14 249

原创 大模型(LLM)到底是什么?

因为它在训练时看过非常多的内容。比如:新闻、文章、网页、书籍、论文、代码、报告、聊天记录、产品说明、商业文案等等。看得多了,它就慢慢学会了很多语言规律和表达套路。比如:它知道面试回答不能只喊口号,要有具体经历支撑;它知道商业计划书通常要讲市场、用户、产品、竞争和盈利模式;它知道小红书文案要更口语、更有情绪、更像真人分享;它也知道代码需要符合语法,不能随便乱写。所以你让它写文案、改简历、总结报告、翻译英文、写代码,它都能做。它不是因为真正经历过这些事情,而是因为它学会了这些内容通常应该怎么表达。

2026-06-17 16:33:51 242

原创 从向量检索到混合搜索:手把手教你搭建生产级RAG检索层(附全代码)

本文介绍了一个完整的RAG检索系统实现方案,包括以下核心组件: 环境准备:Python 3.8+环境,安装ChromaDB、BM25、jieba分词等依赖库 数据准备:提供示例文档数据,涵盖AI开发平台相关内容 向量检索:使用ChromaDB和Sentence-BERT模型实现语义搜索 关键词检索:基于BM25算法实现精确匹配搜索,支持中文分词 混合检索:通过RRF算法融合向量和关键词两种检索结果 精排模块:可选使用Cross-Encoder进一步提升结果准确性 系统特点: 开箱即用,提供完整可运行的RAG

2026-06-17 16:32:38 241

原创 AI最火岗位FDE,如何抓住42倍增长红利?

负责与最重要的战略客户合作,主导前沿模型在生产环境中的复杂端到端部署。简单来说,FDE就是。

2026-06-16 10:45:53 201

原创 AI大模型学习路线,只看这一篇就够了!

本次课程,专门面向产品经理人群,解析当下最热门的AI产品应用的必备的「大模型」、「多模态」的实际应用和算法原理!前段时间还跟字节、腾讯的资深 AI 产品经理沟通,他们反馈:在大量招人,只要有 AI 相关的项目经验,基本都能拿到面试机会,而且领导很舍得给钱,涨薪 40-60% 很正常!对于产品经理来说,如果你不懂技术,做不了业务和AI大模型技术衔接、定义不了数据需求,是没法完整的落地一个产品的!本次课程,全程直播讲解,能直接对话大佬和专业助教,不懂就问,超详细的案例,小白也能轻松get!

2026-06-16 10:43:42 241

原创 大厂AI岗年薪50W+!转型/应届生最后上岸机会,错过等一年!

不知不觉时间又来到了6月份,每年这个时候,大小厂都会放出大量hc,春招补录+暑期实习提前批同步开闸,算是应届生最后一波集中上岸机会,而且也是我们很多在职朋友最好的跳槽、就业时机。最近整理了一下大厂的招聘需求,发现岗位分布和薪资和之前有很大改变:AI大模型全线扩招、而部分常规开发岗大幅收缩、薪资两极分化、面试难度和筛选标准也比往年严格不少,完全是重新洗牌的节奏。(以上信息来源网络)

2026-06-16 10:42:47 1065

原创 从“乱码“到“智慧“:三款开源神器解锁RAG文档处理全流程,让你的知识库“看明白“!

那天,我兴致勃勃地搭建了一个 RAG 知识库,准备把公司的产品手册、技术文档统统喂进去。结果你猜怎么着?当我问“这个产品的保修政策是什么”时,系统给我返回了一堆页眉页脚、表格碎片,甚至还有图表里的乱码。更离谱的是,一份从扫描件转来的 PDF,直接被识别成了“一坨”按坐标排列的字符。那一刻我悟了:RAG 系统的天花板,从来不在大模型,而在文档解析。经过几个月的踩坑,我从 GitHub 上几十个相关项目中,只留下了这三款。今天一次性分享给你。你的场景👉 选它一句话理由📄 日常文档、产品手册。

2026-06-16 10:41:34 206

原创 30个AI核心概念一次说清!从入门到进阶,AI到底在搞什么?

AI行业核心概念解析与应用前景 本文用通俗语言系统梳理了AI领域的30个关键概念,分为六大板块: 基础认知:从AI定义到神经网络原理,阐明技术本质 大模型优势:通过参数、数据集等要素解析性能突破原因 工作原理:语言模型、token机制等核心技术逻辑 Transformer架构:注意力机制等革新性设计解析 人机交互优化:RLHF、智能体等提升实用性的技术 现存局限:幻觉、知识截止等挑战与RAG解决方案 文章特别指出当前AI应用层存在巨大机遇,具备RAG、Agent开发和模型微调能力的工程师极度稀缺。数据显示,

2026-06-15 20:55:42 153

原创 LLM、Skill、MCP、Agent,一篇搞懂AI知识体系

本文通俗解释了AI领域的核心概念及其协作关系:**LLM(大语言模型)**是AI的"大脑",负责文本生成与理解但存在知识局限;Skill是预设指令集,用于优化AI输出;MCP协议为AI提供标准化外部工具连接,使其能操作文件/数据库等;Agent则整合三者,通过自主规划完成复杂任务。文章指出AI应用层(如RAG、Agent开发等)是未来高薪方向,并附学习资源与职业建议,强调掌握这些技术对程序员职业发展的重要性。(149字)

2026-06-15 20:54:28 210

原创 AI 产品经理的 60 个核心概念:从 LLM 到数据飞轮_3万字讲透AI必懂的60个核心概念(汇总版)

01PART LLM 大语言模型技术评审会上算法同事飙了一堆 LLM、Transformer、Attention,你全程点头但一个字没听进去,回去搜了一圈发现解释比原文还绕。不是你理解力差,是这东西被讲得太复杂了。所有人都在吹大模型多强,但很少有人告诉你,它的本质就是一台文字接龙机器。给它一段文本,它预测下一个最大概率出现的词,然后用预测出来的词继续预测下一个,如此往复直到结束。放到点奶茶的场景里看就很直白了。

2026-06-15 20:53:32 258

原创 从0到1:Agent系统落地必做三件事,错过它后悔一年!

这篇文章针对Agent系统开发提出了三个优先补足的核心模块,以构建可迭代的最小可行系统: 工具层 - 赋予Agent行动能力(文件读写/命令执行/API调用),突破"纸上谈兵"阶段。这是连接虚拟决策与现实世界的刚需。 最小工作流 - 建立任务分段机制(计划-草稿-结果),解决复杂场景下的流程混乱问题。比追求多Agent协作更基础的是确保单个Agent的有序执行。 状态与复盘 - 实现执行过程的可观测性(日志记录/中间产物/错误追踪),这是系统可调试、可优化的前提条件。 文章强调,与其过早关注长期记忆、技能封

2026-06-15 20:51:50 228

原创 从互联网产品经理到AI产品经理:8大行业方向深度解析,哪几个是真入口?

对于正在迷茫择业、想转行提升,或是刚入门的程序员、编程小白来说,有一个问题几乎人人都在问:未来10年,什么领域的职业发展潜力最大?答案只有一个:人工智能(尤其是大模型方向)当下,人工智能行业正处于爆发式增长期,其中大模型相关岗位更是供不应求,薪资待遇直接拉满——字节跳动作为AI领域的头部玩家,给硕士毕业的优质AI人才(含大模型相关方向)开出的月基础工资高达5万—6万元;即便是非“人才计划”的普通应聘者,月基础工资也能稳定在4万元左右。

2026-06-13 21:00:18 430

原创 AI智能体中使用的6种LLM模型架构

AI模型已从通用型GPT发展为六种专用架构:通用型GPT、专家型MoE(混合专家模型)、视觉型VLM(视觉语言模型)、推理型LRM(大推理模型)、小型SLM(轻量语言模型)和动作型LAM(大动作模型)。这些模型各司其职,如VLM处理图像理解,LRM专注复杂推理,LAM实现任务自动化。未来AI发展将注重多模型协同而非单一模型参数扩张,强调专业化分工与系统化协作。行业报告显示,大模型相关岗位薪资显著高于其他领域,建议开发者关注这一高潜力方向。

2026-06-13 20:59:13 240

原创 AI Agent 跃迁:从聊天助手到自主行动者,2026年40%企业将拥抱变革!

框架背后力量核心特点OpenAI轻量级,显式交接模式,适合快速原型Anthropic“给Agent一台电脑”,最深的MCP集成Google ADKGoogle多语言(Py/TS/Go/Java),企业级多Agent编排LangGraphLangChain有向图建模,持久执行,最强生产级控制力CrewAI社区角色扮演模式,20行代码搞定多Agent系统VercelTypeScript 生态王者,月下载2000万+

2026-06-13 20:58:17 216

原创 我肝了3天,把AI Agent学习路线扒了个干净

【摘要】Datawhale开源项目Agent-Learning-Hub为AI Agent学习者提供结构化路径,整合基础概念、主流框架(LangChain/AutoGPT等)、进阶方向及实战项目,解决碎片化学习痛点。不同于传统资料堆砌,该项目明确学习顺序与目标,适合新手系统入门或开发者查漏补缺。当前AI人才缺口显著(麦肯锡预测2030年中国缺口达400万),文末附大模型学习资料包(含教程/路线图/面试题等),可通过扫码免费获取,助力技术转型。(149字)

2026-06-10 15:43:21 456

原创 RAG技术方案选型:向量索引的数据结构与量化压缩

为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选很简单,这些岗位缺人且高薪智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。AI产业的快速扩张,也让人才供需矛盾愈发突出。

2026-06-10 15:42:18 172

原创 一文读懂AI新世界:大模型、Agent、MCP、Skills

本文系统介绍了AI领域的四大核心概念及其关系:大模型(LLM)是AI的"超级大脑",负责理解和生成内容;AI Agent是能自主规划执行任务的"智能助理";MCP作为统一协议,让AI能连接外部工具;Skills则是赋予AI专业能力的"技能包"。文章通过生动比喻和层级图示,清晰展现了这些技术如何协同工作:用户下达指令→Agent拆解任务→调用LLM处理内容→通过MCP使用工具→借助Skills完成专业操作。理解这些概念及其协作关系,有助于我们更好地把握AI技术的发展脉络和应用场景。

2026-06-10 15:41:02 233

原创 AI产品经理成长指南:AIGC产品经理2个月上岸秘籍!普通人直接抄

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。✅从入门到精通的全套视频教程✅AI大模型学习路线图(0基础到项目实战仅需90天)✅大模型书籍与技术文档PDF✅各大厂大模型面试题目详解✅640套AI大模型报告合集✅大模型入门实战训练。

2026-06-09 11:08:09 1080

原创 AI七层关系全解析:从Token到Skills,揭秘大模型+Agent的底层逻辑!

本文系统解析了AI七层架构(Token→提示词→上下文→Agent→Harness→MCP→Skills),揭示大模型从指令解析到生成报告的完整链路。通过"客户复盘"案例演示各层协作机制,强调传统开发者向AI转型的必要性。援引2025年招聘数据,指出AI岗位需求激增543%,复合型人才薪资溢价显著。文末提供包含学习路线、实战教程等资料的AI大模型资源包(限时免费),助力开发者把握技术升级机遇。

2026-06-09 11:06:18 225

原创 开到天价的AI Agent岗,到底在招什么样的人

AI Agent工程师高薪背后的逻辑:工程化能力是关键 近期某大厂高薪招聘AI Agent开发工程师引发热议,表面看是调API的工作,实则要求深厚的技术积累。2026年被称为"AI Agent元年",与之前的概念炒作不同,此次需求已落地到工程交付层面。 市场数据显示,AI岗位需求3年翻倍增长,但薪资溢价从3.3倍降至2.6倍,意味着基础技能贬值,真正稀缺的是工程化能力。拆解岗位JD可发现四大核心要求: 1)大模型原理理解 2)Agent系统设计能力 3)主流框架熟练度 4)工程化部署经验 高薪分水岭在于:能

2026-06-09 11:05:26 301

原创 AI离你有多远?从超级实习生到大模型时代,一篇搞懂AI全貌

《AI时代:从入门到精通的全面指南》摘要 本文用通俗语言系统介绍了AI的发展与应用。首先解释了AI的概念,将其比作"超级实习生";然后梳理了AI演进的四个阶段:规则时代、机器学习时代、深度学习时代和大模型时代。文章重点剖析了AI三大支柱(数据、算法、算力)和ChatGPT的工作原理,展示了从输入到输出的完整处理流程。最后列举了AI在各领域的应用场景,并给出普通人抓住AI红利的5大建议:学习AI思维、掌握工具、结合专业优势、输出内容、保持开放心态。随文附赠包含视频教程、学习路线、技术文档等资料的AI大礼包,帮

2026-06-09 11:03:47 207

原创 ,自学AI大模型学习路线推荐,从零到精通:AI大模型自学实战路线图

本文提供了两条AI大模型学习路径:一条系统化的长期路线和一条3个月速成的“邪修路线”。长期路线分为六个阶段:数学与编程基础→机器学习入门→深度学习进阶→大模型探索→强化学习与论文研读→社区参与与持续学习,推荐了Khan Academy、Coursera等平台课程及经典教材。速成路线则聚焦四大实战模块:大模型基础→RAG应用开发→Agent架构→微调与部署,强调快速掌握核心技能实现职业跃迁。文末附赠免费学习资料包,涵盖文档、代码等资源,可通过扫码获取。两种方案分别适合稳扎稳打型学习者和急需转型的从业者。

2026-06-08 15:31:07 339

原创 RAG效果差?7大存储优化策略,让你的准确率飙升!

检索增强生成(RAG)技术通过将大语言模型生成过程锚定至企业私有知识库,构建了包含原始文件、元数据、文本切片和向量数据的四层存储架构。文章分析了不同存储层级的技术定位,并重点对比了原始文件存储的五种技术方案:轻量级云原生存储MinIO、统一存储平台Ceph、海量小文件优化方案SeaweedFS、低资源消耗方案Garage以及高性能缓存网关JuiceFS。各方案在性能、扩展性、运维复杂度等方面存在显著差异,需根据企业具体需求选择,形成完整的RAG数据生命周期管理方案。

2026-06-08 15:29:48 209

原创 RAG实战面试避坑指南:从Demo到系统设计的进阶秘籍

本文通过一个基于LangChain的"藜麦百科文本"RAG示例,系统解析了RAG问答应用的完整工程实现逻辑。文章指出RAG面试考察的核心是系统设计能力而非框架API记忆,重点剖析了数据构建、文档切分、向量化入库、Prompt设计、多轮检索等关键环节的技术细节与设计考量。文中对比了RAG与直接Prompt、微调方案的适用场景,强调切块策略、Embedding选择、Prompt约束等设计决策对系统效果的决定性影响,并揭示了Demo与生产系统的本质差异。文章旨在帮助开发者从运行Demo进阶到掌握RAG系统设计的核

2026-06-08 15:28:23 215

原创 【干货收藏】大模型学习必备10本经典书籍,非常详细收藏我这一篇就够了

如果说AI大模型是蕴藏着巨大能量的“后台超级能力”,那么AI大模型应用开发工程师就是将这种能量转化为实用工具的执行者。AI大模型应用开发工程师是基于AI大模型,设计开发落地业务的应用工程师。这个职业的核心价值,在于打破技术与用户之间的壁垒,把普通人难以理解的算法逻辑、模型参数,转化为人人都能轻松操作的产品形态。

2026-06-04 17:13:33 519

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除