AI技术
文章平均质量分 93
cooldream2009
喜欢写代码,也喜欢和写代码的朋友一起探讨问题,分享收获,共同成长。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
基于 AutoDL 云算力使用 LLaMA Factory 微调大模型及 API 服务搭建完整记录
本文详细介绍在 AutoDL 云服务器上使用 LLaMA Factory 进行大模型微调的完整操作流程,包括环境安装、WebUI 使用、模型训练、微调后对话、模型导出以及 API 部署等环节。通过本文,您将掌握使用 LLaMA Factory 对 Qwen 等系列模型进行 LoRA 微调的核心方法,并能够独立完成从训练到部署的全流程操作。原创 2026-05-22 22:19:33 · 386 阅读 · 0 评论 -
利用网络算力使用 Unsloth 实现llama大模型的微调部署调用
大模型微调是让通用大模型适应特定任务或领域的重要技术。传统全参数微调需要昂贵的 GPU 资源,而 Unsloth 通过 QLoRA 4bit 量化技术,将微调的显存需求降低 50% 以上,同时保持训练速度提升 2-5 倍。本文详细介绍在 AutoDL 云服务器上使用 Unsloth 进行大模型微调的完整操作流程,包括环境配置、模型下载、微调训练、权重合并以及 API 部署。原创 2026-05-22 16:44:33 · 490 阅读 · 0 评论 -
DeepSeek V4 与 LangChain 集成:从入门到生产级应用
2026年4月24日,DeepSeek正式发布V4版本。LangChain是当前最成熟的LLM应用开发框架,拥有庞大的组件生态,几乎涵盖了LLM应用的所有核心场景。将DeepSeek V4接入LangChain,意味着开发者可以复用成熟的生态组件,快速构建基于国产大模型的智能应用。本文围绕三个核心问题展开:DeepSeek V4是什么、有哪些核心优势;如何用LangChain调用DeepSeek V4;以及生产环境中需要注意哪些关键事项。本文面向具备一定Python基础的开发者,无需深度学习背景。原创 2026-05-07 19:57:43 · 701 阅读 · 0 评论 -
Unsloth微调实战:用LoRA技术打造专属文言文翻译模型
Unsloth 作为一款新兴的模型训练加速框架,通过优化显存占用和训练速度,让普通开发者也能在消费级GPU上完成高质量的模型微调工作。本文将以文言文翻译任务为实战案例,手把手教您搭建完整的Unsloth微调环境,并完成从环境配置到模型推理的全流程操作。本文的核心目标是:帮助读者在本地环境中完成一个能够将古文翻译为现代文的LLM微调模型。通过这个实战项目,您将掌握Unsloth的基本使用方法、LoRA微调的核心原理,以及模型推理的实际操作流程。原创 2026-05-03 18:17:23 · 443 阅读 · 0 评论 -
vLLM 大规模推理部署全攻略-以Qwen3-8B为例
本文将为您提供一份详尽的 vLLM 部署指南。从核心原理的深度解析到环境搭建、模型下载,再到生产环境的服务部署与性能优化,我们将全方位覆盖。无论您是希望在本地验证模型的开发者,还是需要在生产集群中构建高可用 API 服务的架构师,这篇长文都将为您提供极具价值的参考。原创 2026-04-18 22:17:15 · 481 阅读 · 0 评论 -
Ollama本地部署与远程访问全流程实战指南
Ollama 作为当前主流的本地大模型运行框架之一,通过对模型加载、推理服务、API接口的统一封装,大幅降低了使用门槛,使开发者能够以接近“服务化”的方式调用本地模型。本文将在不仅覆盖安装与配置流程,还将深入讲解网络访问机制、系统层面原理以及常见问题的工程化排查方法,帮助你构建一个稳定、可扩展的本地大模型服务环境。原创 2026-04-11 09:56:17 · 743 阅读 · 0 评论 -
基于 Docker 部署 Hermes Agent 并接入飞书机器人的完整指南
在 AI 技术快速发展的今天,将大模型能力接入企业办公系统已经成为一种趋势。无论是智能问答、自动化办公,还是企业知识库,AI 助手都能极大提升效率。而如何快速、稳定地部署一个可用的 AI 系统,是许多开发者面临的第一道门槛。本文将围绕开源项目 Hermes Agent,手把手带你完成从部署到接入飞书机器人的完整流程。相比零散教程,本文不仅提供详细步骤,还会补充关键原理说明与实践建议,帮助你真正掌握这套方案。原创 2026-04-10 16:21:31 · 6266 阅读 · 0 评论 -
Claude Code 安装与使用指南:以MiniMax M2.5 为例的完整实践
本文将基于实际操作经验,系统介绍 Claude Code 在 Windows 环境下的完整安装流程,并以 MiniMax M2.5 为例,讲解如何进行配置与使用。同时也会介绍命令行的基本操作方式,以及在 VS Code 中使用 Claude Code 的方法。如果你希望在本地终端中拥有一个类似 AI 编程助手的体验,那么这篇文章将提供一套完整且可落地的实践方案。原创 2026-03-15 21:37:07 · 2054 阅读 · 0 评论 -
面向训练的 AI 设计——辩论、陪练、教学三种模式的策略与反馈体系
训练的核心目标并不是获得一句看似合理的回答,而是通过持续、结构化、可反馈的互动,促使学习者能力发生可验证的提升。在“辩核 AI 具身辩论数字人系统”中,系统被明确定位为**训练系统**而非聊天产品,其核心差异并不体现在模型参数规模,而体现在模式设计、策略约束与反馈机制之中。本文将围绕辩论模式、陪练模式与教学模式三种核心形态,系统阐述其背后的设计逻辑与工程化实现思路。原创 2026-01-28 19:34:51 · 1288 阅读 · 0 评论 -
从语音到策略——ASR + 大语言模型驱动的辩论对话系统设计实践
在“辩核 AI 具身辩论数字人系统”中,对话系统不仅要“听懂用户在说什么”,还要“理解这句话在辩论结构中的位置”,并据此作出具有策略性的回应。本文将完整拆解系统中从语音输入到大语言模型决策,再到输出协同虚拟人表达的核心工程链路,重点说明其设计思路与关键实现。原创 2026-01-28 17:05:32 · 987 阅读 · 0 评论 -
虚拟人即界面——XmovAvatar SDK 在具身辩论系统中的设计与封装实践
具身智能的引入,使 AI 不再只是一个隐藏在屏幕背后的算法实体,而是以“虚拟人”的形式直接参与到交互过程中,成为用户感知 AI 的第一入口。在“辩核 AI 具身辩论数字人系统”中,虚拟人并非装饰性展示组件,而是承担着表达、反馈、节奏控制等关键职责。本文将围绕 XmovAvatar SDK 在系统中的引入背景、能力封装方式以及与 AI 对话系统的协同机制,系统性地阐述“虚拟人即界面”的设计理念与工程实现。原创 2026-01-27 20:36:50 · 950 阅读 · 0 评论 -
前端技术架构详解:Vue 3 + TypeScript + Vite 在具身 AI 系统中的实践
在辩核AI具身辩论数字人训练系统中,前端不再只是界面渲染工具,而是整个系统的**实时交互中枢**:它需要同时协调语音输入、虚拟人状态、大模型流式输出以及复杂的训练逻辑反馈。这意味着,前端工程必须具备高度的结构化、强类型约束和可维护性,否则系统复杂度会迅速失控。本文将结合辩核AI具身辩论数字人训练系统的实际设计,系统性拆解其前端技术架构,重点说明 Vue 3、TypeScript 与 Vite 如何协同工作,支撑一个高实时性、高复杂度的 AI 交互系统。原创 2026-01-27 20:30:18 · 1084 阅读 · 0 评论 -
从辩论训练到具身智能——辩核AI具身辩论数字人系统整体设计思路
辩核AI具身辩论数字人训练系统,正是基于这一现实需求而提出的一种新型解决方案。它并非简单地“接入一个大模型”,而是围绕辩论训练的真实流程,从交互形态、系统架构和能力边界三个层面进行整体设计,引入虚拟人具身表达、语音交互和多模式辩论策略,使 AI 从“会说话”走向“会辩论、会训练、会反馈”。本文作为系列文章的第一篇,将从整体视角出发,重点回答三个问题:为什么要做这样一个系统,这个系统解决什么问题,以及它在架构层面是如何被系统性设计的。原创 2026-01-26 17:34:35 · 748 阅读 · 0 评论 -
Agent Skill:新一代 AI 设计模式的原理、实践与 MCP 协同应用解析
Anthropic 推出了 **Agent Skill(智能体技能)** 这一全新的 AI 设计模式,并在 2025 年正式发布开放标准,使其从 Claude 生态走向跨平台通用能力。Agent Skill 不再只是一次性 Prompt,而是一种**结构化、可复用、按需加载的“操作说明书”**,用于系统性地教会大模型“如何做事”。本文将在已有材料的基础上,对 Agent Skill 的**概念、技术原理、设计结构、创建方式、与 MCP 的差异及协同模式**进行系统梳理和扩展,帮助开发者从工程视角真正理解原创 2026-01-25 10:00:23 · 1407 阅读 · 0 评论 -
辩核AI具身辩论数字人训练系统:技术架构与功能体系全解析
“辩核AI具身辩论数字人训练系统”正是在这一背景下设计的一套综合性解决方案。系统以 3D 虚拟人作为交互载体,以大语言模型作为核心推理引擎,融合语音识别、实时渲染与多模式辩论策略,面向辩手训练、教学指导以及逻辑表达能力提升等多种应用场景。本文将从整体架构、核心技术、功能模块与业务流程等多个层面,对该系统进行系统化梳理与深入解析。原创 2026-01-24 21:53:10 · 962 阅读 · 0 评论 -
从蓝图到世界:深度解析 Protégé 本体建模核心术语体系
Protégé 界面中那些看似相似的术语——Entity、Class、Property、Individual——常常令人困惑。这些术语究竟是并列关系还是包含关系?它们各自在知识建模中扮演着什么角色?本文将通过系统的梳理和生动的比喻,为你拆解 Protégé 本体建模的核心术语体系。无论你是语义网初学者、知识工程师,还是对知识表示感兴趣的研究者,这篇文章都将帮助你建立起清晰的概念框架,让你在构建自己的"知识宇宙"时更加得心应手。原创 2025-12-24 22:24:54 · 1682 阅读 · 0 评论 -
薅羊毛也要讲技术:AI Ping 平台免费体验 GLM-4.7 与 MiniMax-M2.1
AI Ping 平台提出了“一站式大模型服务评测与 API 调用”的解决方案,试图通过统一入口、统一调用方式和统一体验,帮助开发者更高效地使用大模型。本文将围绕 AI Ping 平台展开,重点聚焦当前平台中两款较新且能力突出的模型——GLM-4.7 与 MiniMax-M2.1,从平台定位、模型能力、工程实践和选型建议等多个维度进行系统梳理与分析,力求为开发者提供一篇具有实用价值的参考指南。原创 2025-12-24 15:20:19 · 1172 阅读 · 0 评论 -
从软件到智能体:AI Agent 作为软件发展的最新阶段
当软件能够理解语义、进行推理、调用工具、长期执行任务并与其他智能体协作时,它已经不再只是“被控制的程序”,而开始表现出某种程度的自主性。本文将围绕一个核心判断展开:**AI Agent 是软件发展的最新阶段**。在此基础上,本文以“规划、工具、记忆、协作、行动”五大能力为主线,对 Agent 的结构进行系统化拆解,并进一步解释 MCP、Context、A2A、Reasoning 等关键概念在整体体系中的位置。原创 2025-12-15 16:36:38 · 795 阅读 · 0 评论 -
从工程资产到即时工具:AI 原生软件开发与氛围编程的范式分化
随着大模型能力的跃迁,软件开发正在经历一场深层次的范式重构。一方面,企业开始系统性地将 AI 作为核心能力嵌入复杂软件系统,形成所谓的 **AI 原生软件开发**;另一方面,一种以“现在能用”为最高目标的 **氛围编程(Vibe Coding)** 快速流行,软件被快速生成、快速使用、快速抛弃。 这并非简单的效率差异,而是对“什么是软件”“软件值不值得工程化”这一根本问题的不同回答。本文将在充分融合前述讨论的基础上,从理念、工程方法、技术栈、架构、流程、成本、组织与商业视角等多个层面,系统拆解这两种模式原创 2025-12-15 16:03:52 · 917 阅读 · 0 评论 -
RISC-V 全景解析:在 x86 与 ARM 之间,理解开放指令集的真正价值
RISC-V 的出现打破了这种长期稳定的格局。它并不是一家公司的产品,也不是某一代芯片的代号,而是一套完全开放的指令集规范。正因为这种“非传统出身”,RISC-V 往往伴随着争议:有人将其视为颠覆者,有人认为它只是学术玩具。本文将系统性梳理 RISC-V 的背景、设计理念和技术特征,并将其与 x86、ARM 进行多维度对比,帮助读者理解:RISC-V 究竟解决了什么问题,又适合在哪些场景中发挥真正价值。原创 2025-12-14 07:10:41 · 1746 阅读 · 0 评论 -
Cursor 中 @ 符号的深度用法解析:文件、代码与文档的高效上下文管理指南
Cursor 中的 **@ 符号系统(@Files、@Folders、@Docs、@Code 等)**,让开发者可以在 AI 对话中结构化、有选择地注入上下文,大幅提升回答的精准度与效率。本文将系统介绍 @ 符号的完整使用方法,包括其作用场景、操作方式、上下文控制技巧,并通过多个实际示例帮你构建从“能用”到“会用”的全面理解。原创 2025-12-09 21:12:23 · 1541 阅读 · 0 评论 -
深入探索 AI Ping 平台与 Claude 集成:安装、配置与图像生成应用
在人工智能的不断发展中,图像生成技术已成为其中一项令人瞩目的创新。随着越来越多的 AI 平台提供图像生成服务,如何高效地集成这些技术成为了开发者面临的一大挑战。本文将详细介绍如何通过 AI Ping 平台结合 Claude,实现图像生成模型的应用。通过本教程,你将学会如何安装 Claude,配置 AI Ping,使用 AI Ping 的百炼模型生成创意图像,并将这些技术集成到你的应用程序中,提升项目的互动性与用户体验。原创 2025-12-09 14:36:43 · 990 阅读 · 0 评论 -
深入理解 Cursor 规则体系
随着基于 AI 的智能开发工具不断涌现,Cursor 正逐渐成为新一代工程师的强力助手。它不仅能生成代码,更能在项目结构、风格约束和团队协作中提供持续一致的智能辅助。为了让 AI 在每次补全中保持稳定的上下文与规则意识,Cursor 引入了 **规则系统(Rules System)** —— 一个可持续、可配置、可协作的模型提示层机制。本篇文章将从规则的分类、结构、应用方式到团队实践,系统解析 Cursor 规则体系的完整逻辑,并给出架构设计建议、组织管理方式、示例场景与最佳实践。原创 2025-12-08 22:13:17 · 1617 阅读 · 0 评论 -
Cursor Chat 三大模式:Agent、Ask、Plan 解析(2025 版)
对于现代开发者而言,AI 辅助开发工具已从“锦上添花”演变为“必不可少”。Cursor 作为当前最受欢迎的 AI IDE 之一,凭借其强大的智能体(Agent)能力、深度代码库理解和多工具协调处理能力,正在重新定义软件开发流程。在 Cursor 中,Chat 面板的三大模式——Agent、Ask、Plan,分别对应不同层次的开发需求:从快速问答到深度理解代码,再到复杂任务的分步实现规划,每一种模式都在帮助开发者以更高效、更安全、更可控的方式完成工作。原创 2025-12-08 14:55:59 · 7973 阅读 · 0 评论 -
小智 AI 智能音箱深度体验全解析:人设、音色、记忆与多场景玩法的全面指南
小智的最大特点并不是某一项功能更先进,而在于它具备“可塑性”——你可以亲手定义它是谁、它的性格如何、它怎么和你相处,以及在不同场景中它要扮演怎样的角色。它既可以是工作助手,也可以是学习导师;既能是 K 歌教练,也能是露营和旅行中的陪伴者;甚至还能成为具有完整人格的 AI 伙伴。本文将从产品特性、核心能力、场景玩法、创意用法等角度系统解读小智音箱的深层价值,帮助你学会如何真正用好这款音箱,让它成为生活中的智能帮手与情感支点。原创 2025-12-05 17:34:33 · 2342 阅读 · 1 评论 -
【鸿蒙 2025 领航者闯关】鸿蒙6.0 开发智能家居实战 :星盾安全、超级隐私模式与跨设备协同的深度复盘
智能家居天然是鸿蒙分布式能力的“杀手级场景”。本文字重心落在一个真实项目:基于鸿蒙 6.0 实现“人靠近摄像头 → AI 自动识别 → 客厅灯光自动亮起 + 摄像头画面敏感区域自动遮挡”的完整链路,同时对比鸿蒙 5.x 与 6.0 在启动速度、内存占用、分布式发现延迟等关键指标的实测数据。本文将带你从 0 到 1 走完整个落地过程,并毫无保留地公开所有踩过的坑、调优手段和最终性能数字,希望对正在或即将上车鸿蒙 6.0 的开发者有所帮助。原创 2025-12-03 15:29:59 · 2236 阅读 · 1 评论 -
Cursor 中 Tab 键使用的深度解析
在 Cursor 中,Tab 键不仅仅是传统意义上的缩进工具,它被赋予了更智能、更语义化的交互逻辑:接受补全、部分接受、光标位置预测、自动格式化、多行协同等功能,让你在不同情境下都能以更自然的方式完成编码。本文将系统、深入地介绍 Cursor 中 Tab 键的工作机制、使用场景、设置选项以及进阶技巧,使你能够彻底掌握 Tab 键与 Cursor AI 的协作方式,提升编码速度和代码质量。原创 2025-12-03 15:13:22 · 1722 阅读 · 0 评论 -
体系化深度解析DevUI 企业级前端的 8 大核心组件
DevUI 基于大规模企业产品实践沉淀,被广泛用于云管平台、运营后台、政务与金融等复杂场景。在这些系统里,一组被高频使用的核心组件支撑着后台的基础能力,包括数据展示、表单输入、交互流程、状态反馈与消息通知。本文将重点解析 DevUI 中最具代表性的 8 大组件:DataTable、Form、Modal、Select、Tabs、Pagination、Loading 与 Toast。通过设计理念、技术实现与典型业务场景三个维度,展示它们如何构成企业级前端稳定、高效、可维护的底层能力体系。原创 2025-11-25 08:09:50 · 1548 阅读 · 2 评论 -
从描述到代码:深入解析 Claude Code 的能力、使用方式与高效实践
Claude Code 的诞生改变了这一切。它不只是一个可以回答问题的聊天模型,而是一位能够阅读代码、修改文件、执行命令、与外部系统互通的“虚拟工程师”。它以终端为中心,与真实的开发环境紧密整合,让工程师可以直接以自然语言操作代码库,从而显著提升研发效率。本文将从 Claude Code 的能力、使用方式、交互技巧以及实际案例等方面进行深入解析,帮助你系统理解它能做什么、如何使用、如何让它真正融入你的开发流程。原创 2025-11-24 09:24:40 · 1213 阅读 · 0 评论 -
使用 Claude Code 与 Doubao Seed Code 模型从零构建 2048 网页版:安装、配置、实践全指南
本篇文章将以“**从零构建一个仅需单个 HTML 文件的 2048 网页游戏**”为目标,把 Claude Code 的安装、配置、命令说明与 Prompt 实战完整呈现出来,帮助你快速掌握它的使用方式,并通过真实项目体会 AI 辅助开发的魅力。原创 2025-11-24 09:05:39 · 1275 阅读 · 0 评论 -
从一张 UI 图到完整电商网站:基于 Doubao-Seed-Code 与 Claude Code 的智能开发实测
本次测评选择了一个贴近真实业务的任务:给模型一张电商首页设计图 jdhome.png,让模型自动分析图像内容,并实现 Vue 前端与 Python 后端的完整电商网站。为进一步贴合开发场景,本次测试在 Claude Code 环境中运行 Doubao-Seed-Code,以获得更接近真实程序员工作方式的体验。原创 2025-11-22 14:45:31 · 1456 阅读 · 0 评论 -
从入门到精通 LlamaIndex RAG 应用开发
LlamaIndex 通过一套清晰的组件体系,将「原始数据」转化为可供 LLM 查询的「知识索引」,让开发者能够轻松实现问答、搜索、数据分析甚至自主代理(Agent)。本文将带你从入门到实践,完整了解如何使用 LlamaIndex 构建一个可扩展、可信赖的 RAG 系统。原创 2025-11-09 12:06:36 · 1479 阅读 · 0 评论 -
构建智能问答的核心:LlamaIndex 在 RAG 系统中的应用详解
在众多RAG框架中,**LlamaIndex** 是目前最受欢迎、最灵活的方案之一。它为开发者提供了从数据加载、索引构建、检索到问答生成的一体化工具链,使得构建知识增强型AI应用变得前所未有的简单。本文将系统介绍 LlamaIndex 的核心理念、使用理由、关键功能,并通过一段最小化示例代码,帮助你理解它在RAG中的作用机制。原创 2025-11-09 11:51:35 · 1202 阅读 · 0 评论 -
LangChain 构建智能多工具 Agent实践
借助 LangChain 框架,我们可以轻松地创建一个能与多种不同工具交互的 Agent,让它具备信息检索、搜索和多轮对话记忆的能力。本文将深入解析如何:- 使用语言模型的 **工具调用能力**;- 创建并封装 **本地数据库检索器(Retriever)**;- 集成 **在线搜索工具**;- 构建一个可 **多轮对话记忆** 的智能 Agent;- 通过示例代码展示从初始化到运行的完整过程。原创 2025-11-05 20:12:25 · 1631 阅读 · 0 评论 -
解锁语义搜索的力量:全面解析向量数据库(Vector Database)
关系型数据库(如 MySQL、PostgreSQL)或文档型数据库(如 MongoDB)来存储结构化数据,但这些系统在处理语义搜索或相似性查询时显得力不从心。当问题从“找出字段完全匹配的记录”变为“找出语义上相似的内容”时,一种全新的存储与检索机制——向量数据库(Vector Database)登上舞台。向量数据库以“理解语义”为核心,能够处理文本、图像、音频等非结构化数据的相似性查询,成为构建智能搜索、RAG(检索增强生成)和推荐系统的关键基础设施。原创 2025-10-31 07:59:46 · 1337 阅读 · 0 评论 -
深入解析 LangChain 文本分块核心:RecursiveCharacterTextSplitter 全面指南
在向量化检索的世界里,切分策略直接影响**知识块的语义完整性**与**召回精度**。如果切得太碎,语义被割裂;如果切得太粗,召回会失焦。LangChain 在这一环节提供了一个极其经典且高效的组件——`RecursiveCharacterTextSplitter`,几乎成为所有 RAG 项目的“默认入口”。本文将深入解析该组件的设计原理、关键参数、使用方法与优缺点,并结合实际案例帮助你理解为什么它能成为最受欢迎的文本分块策略之一。原创 2025-10-30 10:07:01 · 1429 阅读 · 0 评论 -
LangChain 文本拆分核心解析:全面掌握 TextSplitter 的设计与实践
在 LangChain 框架中,这一核心能力由 **TextSplitter** 模块承担。它不仅能将文本按照不同策略进行高效拆分,还能保证语义连续性,为后续的向量化与检索提供高质量输入。本文将从设计原理、主要类型、关键参数、核心方法、应用示例与实践建议六个方面,全面解析 LangChain 的 TextSplitter。原创 2025-10-30 09:13:37 · 1349 阅读 · 0 评论 -
全面详解 Chunking 文本拆分策略
一个强大的 RAG 系统不仅依赖于先进的语言模型和向量数据库,更取决于一个常被忽视但至关重要的环节——Chunking(文本分块)。一个高质量的 Chunking 策略,是 RAG 成功的基石。它直接影响检索的相关性、答案的准确性以及系统的整体性能。本文将带你深入理解 Chunking,从基础原理到智能分块策略,帮助你全面掌握这一 RAG 核心技术。原创 2025-10-29 07:54:09 · 1131 阅读 · 0 评论 -
LangChain 文档加载器:统一多源数据接入的基石
无论是企业内部知识问答、RAG(Retrieval-Augmented Generation)系统、还是法律文档分析、学术论文检索,模型都需要先“读懂”外部信息。而这些信息往往分散在各种来源:PDF 文件、网页、数据库、API、甚至云端文档系统。 如果每种数据源都需要独立解析,将导致极高的系统维护成本。为此,LangChain 提供了一个强大而优雅的组件:**文档加载器(Document Loaders)**。 它的目标就是让开发者只需关注「数据内容」,而无需关心「数据来源」。原创 2025-10-29 07:38:09 · 887 阅读 · 0 评论 -
LangChain RAG 流程与相关技术全解析
LangChain 作为最受欢迎的 LLM 应用框架之一,提供了强大的 RAG 实现机制。从文档加载、文本切分、嵌入生成、向量数据库管理到智能检索与生成增强,LangChain 让开发者能够快速搭建一个结构完善的知识增强问答系统。本文将系统解析 **LangChain 的 RAG 工作流程**,剖析其背后的关键技术原理,并附上一个可直接运行的检索问答示例。原创 2025-10-28 08:55:05 · 972 阅读 · 0 评论
分享