自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(528)
  • 收藏
  • 关注

原创 值得收藏!2025企业级AI Agent落地指南:掌握MCP、GraphRAG、AgentDevOps、RaaS四大核心趋势

当前企业级 AI Agent 已实现从 “工具” 到 “岗位” 的跃迁,下一阶段的核心方向是成为 “岗位专家”。一方面通过 “自动化清洗 - 专家话术提纯 - 合成数据扩充” 的工业化数据体系,结合强化学习优化奖励模型,让 AI Agent 的能力向 “金牌员工” 对齐;另一方面通过多样化能力细化场景,例如金融领域的实时沟通策略调整、方言适配等,满足细分需求。当 AI Agent 具备岗位专家能力,实现模板化复用且价值与财务口径精准对齐时,规模化部署的条件将完全成熟,人机共存的全新生态或将全面到来。

2025-12-06 15:27:30 956

原创 【值得收藏】2025最新:知识图谱缓解RAG冲突+多模态文档表格处理技术详解

本文深入解析了知识图谱如何有效缓解大模型RAG系统中的内外部知识冲突,以及多模态文档处理中表格识别的前沿技术。通过结构化知识图谱筛选可靠信息和创新的表格处理方法,帮助开发者提升大模型应用的准确性和可靠性。无论您是RAG系统开发者还是文档处理研究者,这些技术思路都将为您的项目提供实用参考。本文来源于网络,由于如有侵权,请联系删除。今天是2025年11月14日,星期五,北京,天气晴继续回到RAG和文档智能方向。来看基于知识图谱缓解大模型RAG内外部冲突思路,

2025-12-06 15:25:07 1294

原创 收藏!从零到精通RAG技术:大语言模型检索增强生成实战指南

随着ChatGPT的兴起,大语言模型再次走进人们的视野,其在NLP领域表现出的语言识别、理解以及推理能力令人惊叹。越来越多的行业开始探索大语言模型的应用,比如政务、医疗、交通、导购等行业。通义系列、GPT系列、LLama系列等模型,在语言交互场景下表现十分抢眼。以Gemini为代表这类大模型甚至发展出了视觉和听觉,朝着智能体的方向演化。他们在多个指标上展现的能力甚至已经超过了人类。

2025-12-05 22:49:35 689

原创 收藏必备!深入浅出RAG检索增强生成技术:从原理到实践优化指南

RAG(检索增强生成)技术正成为提升AI系统回答准确性的关键。本文全面解析RAG技术原理、优势与局限,并深入探讨从索引优化、查询处理到结果筛选的全链路优化方法。无论你是AI新手还是寻求技术突破的开发者,本文都能帮助你构建更智能、更可靠的RAG系统,解决知识更新、复杂任务处理等实际问题,让你的AI应用更上一层楼。RAG,全称为 Retrieval-Augmented Generation,即检索增强生成。

2025-12-05 22:47:15 789

原创 收藏必备:RAG技术从入门到精通,5种企业级解决方案深度解析

Naive RAG是RAG技术中最基础的一种方式。它的核心原理很简单,就是在生成文本之前,先从外部知识源(如文档数据库)中检索相关信息,然后将这些信息与用户的输入一起输入到语言模型中,让语言模型根据这些信息生成回答。简单来说,就是先找信息,再用信息生成答案。实现起来相对简单,成本较低。对于一些简单的知识检索和问答场景,能够快速给出较为准确的回答。检索的准确性依赖于知识源的质量和检索算法的好坏。如果知识源不准确或者检索算法不够优化,可能会检索到无关的信息,从而影响生成结果的质量。

2025-12-04 20:45:17 521

原创 【收藏必学】知识图谱增强RAG:大模型知识库构建与应用实战

以数据和经验为基础的知识信息管理在各个行业和领域都至关重要,随着知识经济的到来,有效地管理和利用知识信息,成为企业获得竞争优势、促进创新和发展最有效途径。传统的知识存储媒介以纸质为主,借助计算机和互联网技术的发展,越来越多知识信息以电子文档的形式进行存储,以共享知识库为核心,通过建立共享知识和交流平台,实现数据和经验的价值复用。知识库中的数据来源多样,大量的非结构化信息需要人工处理,建设效率低、成本高、周期长。

2025-12-04 20:40:47 734

原创 【干货收藏】大模型时代的RAG技术:从核心逻辑到优化评估,全面提升AI问答质量

• 检索更准:召回覆盖率高、排序准确• 上下文更稳:文档干净、冗余少• 生成更真:幻觉率低、语义连贯通过多维指标量化“召回—生成—事实一致性”的全链路质量,结合自动评估 + 人类评估,实现持续闭环优化。随着大模型的持续爆火,各行各业都在开发搭建属于自己企业的私有化大模型,那么势必会需要大量大模型人才,同时也会带来大批量的岗位?雷军曾说过:站在风口,猪都能飞起来”可以说现在大模型就是当下风口,是一个可以改变自身的机会,就看我们能不能抓住了。那么,我们该如何学习大模型?

2025-10-15 14:44:34 873

原创 【干货收藏】AI Agent三大痛点深度解析:知识库+工作流+Prompt工程,小白也能轻松上手

本文深入解析AI Agent开发的三大核心痛点,通过知识库、工作流与Prompt工程的全面讲解,帮助开发者构建高效可靠的智能系统。本文分为三部分,介绍Agent三大痛点:知识库+工作流+Prompt工程。第一部分是知识库,第二部分是工作流,第三部分是Prompt工程。正文:,需要深度结合业务场景进行设计。设计精准的提示词、编排可靠的工作流,以及构建和维护高质量的知识库,是设计AI Agent的三大痛点。

2025-10-15 14:43:21 1053

原创 【必收藏】12-Factor Agents:让大模型Agent从能跑起来到能用起来的企业级设计指南

工具只是结构化输出,不仅仅是一个技术实现细节,更是一种高层次的架构哲学。大脑和四肢各司其职,通过定义良好的接口通信。对工具链的修改被隔离在单一模块中,变更成本最小化。添加新工具变得快速而安全。所有对外部系统的访问都通过一个集中化的关卡进行管理。遵循这一原则,是构建能够适应快速变化、易于团队协作的生产级Agent系统的核心保障。它确保了你的Agent基础设施是坚固而灵活的,能够支撑业务的长期发展。原则3是关于“协作”的原则。它不再将人类视为系统外的监督者,而是将其作为整个自动化流程中一个。

2025-10-05 10:01:01 916

原创 多模态RAG实战指南:比想象更复杂的AI应用,程序员必学收藏

本文分享了作者将多模态模型与RAG系统结合的实践经验,揭示了多模态应用远比理论复杂的真相。文章详细剖析了多模态模型在实际业务中的应用挑战,特别是不同模态数据间的关联关系处理和数据召回方式等关键问题。对于想要探索多模态RAG系统的开发者来说,本文提供了宝贵的实战经验和思考方向,帮助你少走弯路,更高效地实现多模态与RAG的融合应用。多模态与RAG的结合是一个应用的实践过程,其实际操作远比理论要复杂得多。这段时间一直在搞RAG和Agent,然后使用的基本上都是基于文本处理的推理模型,基本上没用过多模态模型;

2025-10-05 09:58:47 819

原创 【必藏干货】AI产品经理不是一种岗位,而是5种完全不同的职业,小白/程序员少走3年弯路

无论你选择哪一类,

2025-10-04 19:57:54 1230

原创 【必收藏】构建高效AI Agent:提示词工程、工作流设计与知识库构建实战指南

本文系统介绍了在Agentic AI技术快速发展的背景下,如何构建可靠、高效的AI Agent应用。文章重点阐述了提示词工程、工作流设计和知识库构建三大核心竞争力的实践方法。在提示词方面,详细讲解了系统提示词的构成要素和优化技巧;在工作流设计上,推荐使用DSL描述替代自然语言;在知识库构建环节,介绍了RAG技术和向量数据库的应用。通过实战案例和优化建议,本文为开发者提供了从零构建AI Agent的完整指南,包括提示词优化工具、Mermaid流程图应用等实用技巧,帮助开发者快速掌握AI Agent开发的关键技

2025-10-04 19:52:29 966

原创 大模型RAG实战宝典:从原理到应用的收藏级教程

简单查询 → Naive RAG(成本优先)全局分析 → Graph RAG(效果优先)复杂任务 → Agentic RAG(动态规划)完备性 ✓策略有效性 ✓设计价值:多模型验证 → 降低单点决策风险模块5:通用工具库工具典型场景计算器预算分配(例:5000×35%÷3人)Python解释器字数统计/数据清洗多模态处理器图文混合分析。

2025-08-29 15:28:29 1112

原创 收藏!10分钟掌握5个技巧,彻底解决Dify知识库AI胡说八道问题

别再抱怨Dify不好用,可能只是你没用对方法。

2025-08-29 15:24:41 1367

原创 985硕士搞Java还是大模型?

《大模型时代Java程序员转型指南》摘要 当前Java开发岗位面临严重内卷,低代码平台冲击基础岗位,35岁危机显著。相比之下,大模型AI领域存在新机遇,但算法岗门槛极高(需PhD+顶会论文)。建议转向模型应用层:1)利用开源模型快速搭建企业级解决方案;2)专注业务流程与提示词设计;3)发挥硕士学历在业务理解与技术落地的复合优势。学习路径可分为:应用开发→知识库构建→模型微调→商业部署,重点掌握RAG、向量数据库等核心技术。该方向既能规避算法岗的学历壁垒,又能抓住企业数字化转型红利期。

2025-08-25 21:11:36 811

原创 涨薪50%,我是如何成功转行大模型算法的

涨薪50%,我是如何成功转行大模型算法的

2025-06-20 19:15:59 701

原创 一文搞懂大模型、RAG、函数调用、Agent、知识库、向量数据库、知识图谱、AGI 的区别和联系

我们要把 AI 大模型当做人的大脑,因此调用 AI 大模型,相当于调用一个人,把 AI 大模型当人看,TA 懂人话、TA 说人话、TA 会直接给出结果,但结果不一定正确。因此在 AI 大模型的推理基础上,通过 RAG、Agent、知识库、向量数据库、知识图谱等技术手段实现了真正的 AGI(通用人工智能)。这些技术到底有哪些区别和联系,下图作了横向对比,接下来我们详细剖析下。

2025-06-20 19:12:18 1038

原创 只改2行代码,RAG效率暴涨30%!多种任务适用,可扩展至百亿级数据规模应用

只改2行代码,RAG效率暴涨30%!多种任务适用,可扩展至百亿级数据规模应用

2025-06-20 19:07:52 625

原创 Dify 实战教程 | 10分钟搭建你的 Chatflow(数据可视化助手)

本篇我们来聊聊如何使用 Dify 的 Chatflow(对话流程编排器),构建一个Excel 数据可视化助手。在此前的教程中,我们介绍了「聊天助手」和「Agent」构建助手的使用方式,本篇将介绍一种更可控、逻辑更清晰的构建方式——Chatflow 应用。

2025-06-04 16:22:34 1430

原创 Dify 实战教程 | 10分钟搭建你的聊天助手(旅游顾问)

步骤内容第一步新建应用,选择聊天助手第二步填写应用基础信息第三步设计提示词第四步配置用户输入字段(可选)第五步测试并发布零代码搭建专属聊天助手,就是这么简单!大模型作为新时代的风口,确实为那些希望转行或寻求职业突破的人提供了广阔的舞台。然而,是否选择进入这一领域还需综合考虑自身的兴趣、特长以及长远规划。通过构建基础知识体系、参与实际项目、拓展软技能、关注跨学科融合以及建立广泛的社交网络,你可以在这个充满机遇的新领域中迅速站稳脚跟。

2025-06-04 16:20:53 1018

原创 大模型好书推荐 - 《多模态大模型:技术原理和实战》(附送PDF电子版)

《多模态大模型:技术原理与实战》 是一本深度解析大语言模型与多模态大模型的权威著作。该书系统回顾了大语言模型和多模态大模型的发展历史,详尽阐述了它们的技术原理、核心亮点以及主要特性。书中不仅介绍了众多关键的开源框架和配套工具,还详细讲解了模型的部署细则,同时特别精选了三个使用大模型为商业赋能的应用案例, 为读者提供了从理论到实践的全面指导。

2025-06-03 17:12:38 1586

原创 一文搞懂大模型的预训练(Pre-training)

今天来聊一聊BERT和GPT的预训练,从而了解大模型的第四步:Pre-training。预训练(Pre-training)是大语言模型(如BERT、GPT)训练的第一阶段,其核心目标是通过自监督学习从海量无标注文本中学习通用的语言表示(Language Representation)。这一阶段的目标是让模型掌握语言的语法、语义、常识等基础能力,为后续的微调(Fine-tuning)打下基础。

2025-06-03 17:11:00 1223

原创 本地部署大模型实现扫描版PDF文件OCR 识别,笔记本可跑

在使用大模型处理书籍 PDF 时,有时你会遇到扫描版 PDF,也就是说每一页其实是图像形式。这时,大模型需要先从图片中提取文本,而这就需要借助 OCR(光学字符识别)技术。``像 Gemini 2.5 这样的强大模型,具备非常强的从图片中提取文本的能力。实际上,我们完全可以利用它来执行 OCR 任务。

2025-06-03 16:45:07 904

原创 用LLM做文本分类,微调选base还是chat

使用Qwen2ForSequenceClassification实现文本分类任务。

2025-06-01 08:00:00 935

原创 大模型入门,从入门到精通,收藏这一篇就够了,2025年最新版:最全合集,不容错过!

大模型(Large Models)的训练是近年来人工智能领域的核心技术之一,尤其是在自然语言处理、计算机视觉等任务中,如 GPT、BERT 等模型的成功背后,离不开复杂的训练过程。本文将为你介绍大模型是如何训练的,包括数据准备、模型架构、训练方法和硬件支持等方面。

2025-05-30 22:22:21 1052

原创 大模型书籍 | 从入门到精通大模型就看一这一本《掌握Transformer:从零开始构建SOTA模型》(附PDF)

基于Transformer的语言模型已经在自然语言处理(NLP)研究中占据主导地位,现已成为一种新的范式。通过本书,您将学习如何使用Python Transformers库构建各种基于Transformer的NLP应用程序。

2025-05-30 22:18:47 908

原创 五种RAG分块策略详解 + LlamaIndex代码演示

这篇试图说清楚:业界常用的五种 RAG 分块策略核心思想、LlamaIndex 代码演示以及 RAGFlow/Dify 等框架实践思路。

2025-05-29 16:25:03 1020

原创 基于Bad Cases的Dify合同审查案例演示(工作流拆解)

在 RAG 流程中,如何实现基于 Bad Cases(负面案例)的合同审查和合同生成(基于合同模板)的提问,算是一个很有代表性的进阶 RAG 应用方向,这篇针对其中的合同审查场景来做些介绍和演示。

2025-05-29 16:21:26 1469

原创 大模型书籍安利:AI大模型训练数据白皮书|附PDF免费下载

本白皮书首先分析了大模型训练所需的数据类型,并从产业实践出发破解了对训练数据的常见迷思和误解。在上述基础上,本书进而对训练数据的质量和规模进行讨论,发现高质量数据应在实践中检验效果,而难以用前置的客观标准衡量。同时,本书探讨了合成数据作为解决高质量训练数据供给不足的新方案,及其在大模型训练中的潜力。

2025-05-29 16:17:02 1187

原创 用 Vue3 + Node.js + RAG 构建 Al 讲义问答系统(接入豆包大模型)

随着大语言模型(LLM)的迅猛发展,将其应用于教育领域的讲义问答成为可能。然而,传统大模型在处理超出训练数据范围的专业问题时,往往会出现 “幻觉”( 即捏造不正确的内容),降低回答的可信度。为了解决这一问题,业界提出了 检索增强生成(RAG,Retrieval-Augmented Generation) 技术。简单来说,RAG 就像让模型在开卷考试 —— 在回答问题前,先从外部知识库(如讲义文档)中检索相关资料提供给模型参考,从而提高答案的准确性并减少不可靠的臆测)。

2025-05-27 12:02:00 1555

原创 「从零实现 RAG:基于 LangChain 的企业级问答系统实战」

在大模型逐渐普及的今天,Retrieval-Augmented Generation(RAG)作为提升模型可靠性和知识覆盖的重要技术方案,越来越多地被用于企业问答、文档助手、客户支持等场景。本文将带你从 0 开始,基于 LangChain 框架,逐步实现一个可落地的 RAG 系统。

2025-05-27 11:59:33 1520

原创 2025 AI大模型报告 | 《中国数字人发展报告(2024)》(附PDF免费下载)

数字人是通过多种数字智能技术创建,具备人类外观形象、声音语言、肢体动作与思维功能等特征的数字智能体。在技术层面,数字人通过数字建模手段实现,涵盖计算机图形学、动作捕捉、图形渲染、语音合成、深度学习等多项技术。当前,数字人正成为人工智能活跃的应用落地入口,对大数据、智能终端、具身智能等产业链接度、嵌入度、融合度较强,或将成为下一代互联网活跃的交互界面之一。

2025-05-23 16:25:37 583

原创 【大语言模型基础】Transformer模型Torch代码详解和训练实战

Transformer是由谷歌在17年提出并应用于神经机器翻译的seq2seq模型,其结构完全通过**自注意力机制**完成对源语言序列和目标语言序列的**全局依赖建模**。Transformer由**编码器**和**解码器**构成。下图展示了它的结构,其左侧和右侧分别对应着编码器(Encoder)和解码器(Decoder)结构,它们均由若干个基本的 **Transformer Encoder/Decoder Block**(N×表示N次堆叠)。

2025-05-23 16:24:19 499

原创 大模型实战:LangChain+WebBaseLoader实现大模型基于网页内容的问答系统

本文将详细介绍一个基于LangChain和Ollama、WebBaseLoader读取指定网页实现的RAG对话系统,从技术原理到实际代码,全面解析如何构建一个具有上下文感知能力的智能问答系统。

2025-05-21 16:23:53 1156

原创 AI大模型书籍:AI大模型训练数据白皮书|附PDF免费下载

本白皮书首先分析了大模型训练所需的数据类型,并从产业实践出发破解了对训练数据的常见迷思和误解。在上述基础上,本书进而对训练数据的质量和规模进行讨论,发现高质量数据应在实践中检验效果,而难以用前置的客观标准衡量。

2025-05-21 16:19:50 712

原创 借助MarsCode AI助手分析LlamaIndex的工作流可视化

我们总结了LlamaIndex工作流的可视化部分的实现和细节,重点分析了如何利用Python中的pyvis库和Java中的图形库,分别在两种语言中构建和展示网络图。通过代码示例,我们详细探讨了如何构建节点、添加边并通过布局生成交互式图形,同时也提到了在Java中使用Jung库和GraphStream库时可能遇到的挑战与解决方案。

2025-05-13 15:26:08 767

原创 LlamaIndex+Ollama构建《劳动法》问答机器人

本文将一步一步引导大家如何使用LlamaIndex和Ollama构建一个针对《劳动法》的问答机器人。这个机器人能够理解并回答关于这本劳动法的各种问题。

2025-05-13 15:17:36 784

原创 99%的人都应该看看这本书,精简小册子让你快速跨入大模型的世界

书中首先介绍了大模型(LLM)的基础知识,包括语言模型、自然语言处理(NLP)以及Transformer架构,帮助读者快速理解GPT-4等模型的工作原理。通过这本书,读者能够快速掌握大模型的基础知识与开发技巧,特别适合初学者与想要在短时间内完成AI应用开发的开发者。在deepseek爆火的现在,大模型已经不再是开发者专享的东西,未来一定是大模型的世界,不管你是做什么工作,都应该来了解大模型,甚至是开始使用大模型。这一部分不仅帮助我理解了大模型的技术本质,也让我对NLP领域的前沿发展有了更系统的认识。

2025-05-07 16:16:09 685

原创 10分钟搭建AI聊天机器人:Python与LangChain实战教程

那天凌晨三点,我还在修复生产环境的bug。无意间打开了同事的代码,发现他用了近500行Python脚本来对接OpenAI API。天呐!这代码看起来像是用血泪写成的…我笑了。这不就是两年前的我吗?当初为了实现一个简单的AI问答功能,写了一堆繁琐的token处理、上下文管理和错误重试逻辑。如今有了,这些痛苦完全可以避免。LangChain到底是什么?它是构建LLM应用的"乐高积木"。Harrison Chase在2022年10月创建它时,可能没想到它会成为AI应用开发的事实标准。让我直接上手吧!

2025-04-28 17:53:57 1159

原创 图解 LangChain 知识库导入导出,连续奋战只为你简化数据迁移

LangChain 就像是一个智能搬运工,可以帮你轻松搬运和转换各种知识库数据。2. 转换处理2. 知识库迁移3. 远程存储同步2. 知识库导出备份LangChain库是知识数据管理的得力助手,可以帮你:掌握这些技巧,你就能灵活管理AI知识库了,再也不怕迁移麻烦!反正我都连续肝了三天才把这套方案搞定,现在专门写出来,就是想让你少走弯路!大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “”“”等问题热议不断。不如成为,毕竟AI时代,谁先尝试,谁就能占得先机!想正式转

2025-04-28 17:49:43 1258

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除