大模型RAG实战-CSDN博客

原创 DeepSeek新手必看！全功能详解与实操指南

对于有特定需求的用户，DeepSeek还支持上传文件建立自定义知识库。将与自己工作、学习相关的文档、资料上传后，DeepSeek就能基于这些知识为你提供更个性化、针对性更强的回答和建议。例如，企业用户可以上传公司的内部规章制度、业务资料等，让DeepSeek成为企业内部的智能助手；学生可以上传自己的学习笔记、专业文献等，帮助自己更好地学习和复习。

2025-02-05 18:05:20 21258

原创一文带你搞懂什么是生成式人工智能(GenAI)

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

2024-11-13 11:43:32 9458

原创工业大模型市场图谱：53个工业大模型全面梳理（通用、行业、场景大模型）看这一篇就够了！

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

2024-09-21 10:11:41 5690

原创 AI大模型之Prompt工程指南：什么是Prompt工程？Prompt工程的格式与要求

Prompt是一种基于人工智能（AI）指令的技术，通过明确而具体的指导语言模型的输出。在提示词工程中，Prompt的定义涵盖了任务、指令和角色三个主要元素，以确保模型生成符合用户需求的文本。Prompt明确而简洁地陈述了用户要求模型生成的内容。这包括在特定应用场景中，用户希望模型完成的任务或生成的文本类型。模型在生成文本时应遵循的指令是Prompt中的关键要素之一。这些指令具体规定了模型生成文本的方式，通过清晰的语言来引导模型以获得所需的输出。Prompt中还包括模型在生成文本时应扮演的角色。

2024-08-01 22:18:51 22029 1

原创大模型论文 | 大语言模型的全新预训练范式-强化预训练

论文通过强化学习激励有效的下一个token推理，仅使用原始文本和内在强化学习信号就能解锁更丰富的推理能力。

2025-06-12 12:06:04 413

原创大模型论文 | MaAS框架与“智能体超网” (Agentic Supernet)

在本文中，多智能体系统设计的范式从“寻找最优的单个系统”，转变为“优化一个系统的动态分布”。所提出的MaAS框架，通过其核心的“智能体超网”概念，实现了对不同任务的“量体裁衣”，在大幅提升资源效率的同时，取得了SOTA的性能表现。我们相信，MaAS为构建更通用、更经济、更智能的自动化AI系统铺平了道路。

2025-06-12 11:58:26 402

原创解析LLM、RAG、AI Agent的工作原理（九）KV 缓存

KV Caching 的核心思想：Query 每次重新计算，但 Key 和 Value 是历史不变的，可以缓存下来重复使用，从而极大加快推理速度。

2025-06-11 20:00:00 709

原创解析LLM、RAG、AI Agent的工作原理（八）RAG 与 Graph RAG 对比

特征Graph RAG数据结构向量（无结构）图结构（结构化）检索方式纯相似度匹配向量匹配 + 图遍历语义表达可能模糊、浅层更深层次理解实体与关系上下文构建语义最相似段落语义 + 结构相关节点适用场景普通问答、知识补充知识图谱问答、多跳问答、实体推理若你想在问答中引入更丰富、可追溯的背景知识，Graph RAG 是升级选项。特别适合复杂的关系推理，如医学、金融、科研、法律等场景。相比传统 RAG，Graph RAG 可以回答例如“谁是A公司的创始人的配偶？

2025-06-11 13:53:30 617

原创解析LLM、RAG、AI Agent的工作原理（七）传统 RAG 与 HyDE 对比

特征HyDE查询方式直接基于 Query 向量搜索基于 LLM 生成的“假设文档”向量搜索语义丰富度依赖 Query 本身利用 Hypothetical 文本扩展 Query 语义检索效果容易受限于 Query 质量对模糊、短语义 Query 更健壮使用模型一个 Embedding 模型 + 一个 LLM一个 LLM（生成假设）+ 一个 Embedding 模型 + 一个 LLM（最终回答）

2025-06-11 12:03:07 552

原创解析LLM、RAG、AI Agent的工作原理（六）Agentic AI系统的5个级别

层级名称是否调用工具是否支持协作是否自主迭代1❌❌❌2✅（分路由）❌❌3✅❌❌4✅✅❌5✅✅✅。

2025-06-11 11:51:20 978

原创 2025大模型从入门到就业！推荐看这8本大模型书籍+大模型系统学习路线！

首先给大家推荐一份2025年大模型系统学习路线！从入门到精通，学完即可就业！下面根据这份2025最新大模型系统学习路线的知识点，给大家推荐了8本大模型书籍（学习路线+书籍都可以无偿获取~）大模型书籍PDF文档。

2025-06-11 11:15:08 383

原创解析LLM、RAG、AI Agent的工作原理（五）RAG 的 5 种分块方法

策略是否推荐用于正式文本是否保留语义完整性实现难度❌❌⭐✅✅⭐⭐⭐✅✅⭐⭐✅✅✅✅⭐⭐✅✅✅✅✅✅⭐⭐⭐⭐如你正在做文档类RAG项目，推荐结构化切分 + 递归切分或语义切分；若你对效果要求极高、资源充足，可以尝试。

2025-06-10 20:30:00 979

原创解析LLM、RAG、AI Agent的工作原理（四）5 种常见的 Agentic AI 设计模式

这张图介绍了五种最流行的代理AI设计模式，它们分别是：反射模式、工具使用模式、React模式、规划模式和多代理模式。

2025-06-10 20:00:00 1183

原创解析LLM、RAG、AI Agent的工作原理（三）RAG 与 Agentic RAG 对比

RAG 是一种将外部知识库（如文档、数据库）与大语言模型（LLM）结合的技术。它通过“先检索再生成”的方式，让模型不依赖记忆就能回答问题。

2025-06-10 19:00:00 779

原创解析LLM、RAG、AI Agent的工作原理（二）微调LLM 的5种方法

这张图展示了微调大语言模型（LLM）的 5 种常见方法，都是在原模型权重冻结不变的前提下，添加少量可训练参数，以实现高效低成本微调的技术方案。传统的 LLM 微调需要训练数百亿参数，非常耗费资源。LoRA 系列方法通过只训练少量附加参数，让微调变得高效、便宜且更易迁移。

2025-06-10 11:25:55 670

原创解析LLM、RAG、AI Agent的工作原理（一）Transformer 与 LLM 中的混合专家（MoE）

如上图，左边是传统的结构；右边是基于的 Transformer 改进结构。两者前半部分基本相同，主要区别出现在中的部分。

2025-06-10 10:58:18 974

原创大模型RAG技术 | 总结RAG中最容易犯的5个错误

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后，就需要开始准备面试，我们将提供精心整理的大模型面试题库，涵盖当前面试中可能遇到的各种技术问题，让你在面试中游刃有余。因此，我们使用专门的大型语言模型 (LLM) 作为重新排序器，重新排列获取的上下文并进一步过滤，找出最相关的分块。如果你将教科书分解成较小的部分，可能每个部分只讨论一个主题，你就能只获取回答问题所需的相关信息。

2025-06-09 11:52:56 422

原创大模型论文 | 清华提出Test-Time RL，无需标注，模型自学，正确率飙升159%，实现终身学习

AI自我进化，无需人工标注的强化学习来了！过去，训练模型就像教小孩做题——必须提前准备好标准答案（标注数据）。但现实中，许多任务根本没有现成答案，比如解一道全新的奥数题。如何让AI在没有答案的情况下自我提升？这篇论文提出的TTRL（Test-Time强化学习）给出了答案：让AI自己生成答案，通过“投票”选出共识，再用共识作为奖励信号驱动学习。简单来说，就是让AI“自己出题、自己批改、自己进步”。TTRL的核心流程——模型生成多个答案，投票选出最佳，再根据投票结果优化自身面对一个问题（比如数学题），LLM先

2025-06-08 19:45:00 1684

原创模型又更新了！阿里发布Qwen3-Embedding系列模型

阿里发布了Qwen3-Embedding系列模型，包括Qwen3-Embedding和Qwen3-Reranker。专为文本嵌入和排序任务设计，基于 Qwen3 基础模型进行训练。这个系列厉害的地方是，它！不管是日常用的主流语言，还是程序员写的各种代码语言，它都能搞定。它特别擅长在下工作，无论是处理单一语言的资料，还是跨越不同语言查找信息（比如用中文搜英文内容），甚至是在一堆代码里找片段，它都能帮你把需要的数据找出来。

2025-06-07 10:49:40 673

原创一篇详解！以DeepSeek-R1、Qwen3为例搞懂如何微调推理大模型

首先先简单介绍下两个系列的模型：DeepSeek-R1是由深度求索公司推出的首款推理模型，该模型在数学、代码和推理任务上的表现优异。深度求索不仅开源了DeepSeek-R1模型，还发布了从DeepSeek-R1基于Llama和Qwen蒸馏而来的六个密集模型，在各项基准测试中均表现出色。本文以蒸馏模型DeepSeek-R1-Distill-Qwen-7B为例，为您介绍如何微调该系列模型。Qwen3是阿里云通义千问团队于2025年4月29日发布的最新大型语言模型系列，包含2个MoE模型和6个Dense模型。

2025-06-06 20:00:00 782

原创大模型论文 | 一文总结10 种最新的思维链（Chain-of-Thought, CoT）增强方法

行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。在你已经掌握了大模型技术之后，就需要开始准备面试，我们将提供精心整理的大模型面试题库，涵盖当前面试中可能遇到的各种技术问题，让你在面试中游刃有余。可以说是最科学最系统的学习成长路线。书籍和学习文档资料是学习大模型过程中必不可少的，我们精选了一系列深入探讨大模型技术的书籍和学习文档，学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。

2025-06-06 09:53:15 986

原创大语言模型 | 一文搞懂多模态视觉-语言模型：Qwen2.5-VL

这背后的原因是什么？因为现在的多模态视觉-语言模型（例如：Qwen2.5-VL）能很好地把图像和文字关联起来，图像直观且包含的信息量大，再加上模型经过大量图文数据的训练，还针对图像任务进行了优化，这正好符合咱们人类更习惯通过看图来理解的认知特点。

2025-06-04 20:00:00 696

原创一篇搞明白RAG的痛点（六）后备模型、LLM 安全

当使用 LLM 时，你可能会想如果你的模型遇到问题该怎么办，比如 OpenAI 模型的速率限制错误。你需要后备模型，以防你的主模型发生故障。

2025-06-01 08:00:00 708

原创一篇搞明白AI Agent & 多智能体系统！

LangGraph 是由 LangChain 团队开发的。

2025-05-31 20:30:00 804

原创一篇搞明白RAG的痛点（五）结构化数据问答、从复杂 PDF 提取数据

没有对结构化数据进行问答的能力。准确解读检索相关结构化数据的用户查询可能很困难，尤其是当查询本身很复杂或有歧义时，加上文本到 SQL 不灵活，当前 LLM 在有效处理这些任务上存在局限。LlamaIndex 提供了 2 个解决方案。

2025-05-31 08:45:00 920

原创大模型时代，普通人如何抓住风口逆袭？零基础入门AI大模型（非常详细）从入门到精通！

过去一年，ChatGPT-5、Claude-3等大模型的爆发式迭代，让全球AI行业迎来新一轮革命。据招聘平台数据显示，2025年大模型相关岗位薪资同比上涨40%，算法工程师年薪中位数突破50W，而数据工程师、部署工程师等岗位需求更是激增。然而，面对高门槛的技术体系，许多转行者陷入迷茫：“零基础如何入门？哪些方向更容易上岸？

2025-05-30 21:19:20 893

原创一篇搞明白RAG的痛点（四）不完备、数据摄取的可扩展性

输出不完备。给出的响应没有错，但只是一部分，未能提供全部细节，即便这些信息存在于可访问的上下文中。举个例子，如果某人问「文档 A、B、C 主要讨论了哪些方面？」为了得到全面的答案，更有效的做法可能是单独询问各个文档。

2025-05-30 08:15:00 944

原创一篇搞明白RAG的痛点（三）格式错误、不正确的具体说明

输出的格式有误。

2025-05-29 08:00:00 1775

原创大模型论文 | 大模型对齐的本质、核心方法、技术演进、前沿方向

对齐的思想可追溯至20世纪的科幻作品与学术讨论。1920年，科幻剧《R.U.R.》首次提出“机器人威胁”的概念，奠定了早期对机器伦理的思考。1942年，阿西莫夫提出“机器人三定律”，成为最早的AI价值规范雏形。1960年，控制论之父维纳（Norbert Wiener）在《科学》杂志撰文指出：“我们必须确保赋予机器的目标是我们真正渴望的”，这一论述被视为对齐问题的学术起点。

2025-05-28 10:59:58 728

原创一篇搞明白RAG的痛点（二）不在上下文中——合并策略的局限、未提取出来

重新排名之后缺乏上下文。对于这个痛点，上述论文的定义为：「已经从数据库检索到了带答案的文档，但该文档没能成为生成答案的上下文。发生这种情况的原因是数据库返回了许多文档，之后采用了一种合并过程来检索答案。

2025-05-28 08:15:00 895

原创一篇搞明白RAG的痛点（一）内容缺失、错过排名靠前的文档

检索增强式生成（RAG）是一种使用检索提升语言模型的技术。具体来说，就是在语言模型生成答案之前，先从广泛的文档数据库中检索相关信息，然后利用这些信息来引导生成过程。这种技术能极大提升内容的准确性和相关性，并能有效缓解幻觉问题，提高知识更新的速度，并增强内容生成的可追溯性。RAG 无疑是最激动人心的人工智能研究领域之一。但 RAG 也并非完美，用户在使用时也常会遭遇一些「痛点」。

2025-05-27 19:52:21 700

原创企业级大模型知识库部署 | 为什么要在 MacBook上搭建知识库？

另外对于 IT 同学来说，自己亲手搭建一个完整的方案、能灵活调整和对接各种不同的模型、评测各种模型不同的表现，也是出于对技术的探索本能使然。行业分析主要包括对不同行业的现状、趋势、问题、机会等进行系统地调研和评估，以了解哪些行业更适合引入大模型的技术和应用，以及在哪些方面可以发挥大模型的优势。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。在你已经掌握了大模型技术之后，就需要开始准备面试，我们将提供精心整理的大模型面试题库，涵盖当前面试中可能遇到的各种技术问题，让你在面试中游刃有余。

2025-05-23 19:23:55 919

空空如也

空空如也