脱泥不tony-CSDN博客

原创超简单使用A2A和MCP开发DeepSearch和AgentRAG（含源码)

在构建智能代理系统时，如何高效地集成上下文信息并实现代理之间的协同？本文将围绕 A2A (Agent2Agent) 协议和 MCP (Model Context Protocol)，带你快速上手 DeepSearch 和 AgentRAG 示例，并讲解如何自定义开发基于 A2A 和 MCP 的工具。

2025-05-14 16:36:17 952

原创 2025大模型必看书籍推荐：《AI赋能：企业智能化应用实践》企业级 AI智能化赋能应用，附PDF

AI赋能:企业智能化应用实践》是一本深入探讨人工智能技术在企业中应用的专业书籍。本书通过丰富的案例分析和实践经验详细阐述了AI如何助力企业实现智能化转型，提升运营效率和市场竞争力。

2025-05-14 16:31:13 955

原创探索RAG数据分块策略：工具对比与实践指南(含code)

在检索增强生成（Retrieval-Augmented Generation, RAG）应用领域，数据分块作为关键预处理步骤，对模型性能和效果起着决定性作用。本文深入探讨RAG应用中的数据分块策略，详细介绍和对比LangChain、LlamaIndex和Preprocess三种主流工具在数据分块方面的功能与特点，并结合实际案例分析其应用效果，为读者提供全面的技术指引。

2025-05-13 15:41:11 619

原创复旦NLP团队2025新书《大规模语言模型：从理论到实践（第2版）》重磅来袭！

各位读者朋友们，相信你一定还记得，在各大平台AI大模型图书推荐榜单中，《大规模语言模型：从理论到实践》一书始终位居排行榜前列，在2023年末那个时间点，这本书是少有的把大模型相关技术系统汇总整理，既有理论又有实践的。时隔不到两年，大语言模型领域的发展可谓突飞猛进，大语言模型的能力在多个方面实现了显著突破，在推理能力、上下文理解深度及多模态处理能力等方面取得了长足进步。特别是在 2024 年 12 月，DeepSeek-V3的发布，以及 2025 年 1 月 DeepSeek-R1 的问世，更是引发了国内外的

2025-05-13 15:39:21 969

原创深度解析RAG技术在大模型时代的原理与实践

本文将结合Qcon的见闻，基于RAG的核心组件、RAG的常见范式，RAG的应用场景及RAG的评估，介绍当前各大公司使用RAG进行相应应用落地实践情况。

2025-05-09 14:17:39 792

原创 2025最新大模型面试题合集，大模型面试八股文

下是针对大模型（如GPT、LLaMA、PaLM等）技术面试的八股大纲，涵盖核心概念、原理、训练技巧、应用及优化方向等内容，帮助系统化准备面试：

2025-05-09 14:14:31 736

原创检索增强生成（RAG）：大模型落地的「智慧外脑」实践指南

在ChatGPT掀起的人工智能浪潮中，大语言模型（LLM）的问题始终是落地应用的痛点。检索增强生成（Retrieval-Augmented Generation，RAG）技术的出现，正在为这个难题提供突破性解决方案——它让大模型学会「查阅资料」，从此回答有据可依。总的来说，RAG是一种结合了信息检索和自然语言生成的方法，旨在处理自然语言处理任务中的信息检索和生成问题。在问答系统中，RAG可以利用外部知识库中的信息来支持生成更准确和全面的答案，特别是对于需要最新信息或广泛背景知识的问题。

2025-05-07 22:11:51 711

原创狂揽 61K 星！优质开源AI项目-RAG框架/数据检索/Embedding分类

RAGFlow 是一款基于深度文档理解的开源检索增强生成（RAG）引擎。在你的应用程序中集成生成式人工智能的有主见的检索增强生成（RAG）🧠 专注于你的产品，而非检索增强生成技术。可轻松集成到现有产品中并进行定制！支持任何大语言模型：GPT4、Groq、Llama。支持任何向量数据库：PGVector、Faiss。支持任何文件。随你所愿。

2025-05-07 22:06:16 980

原创浙江大学强势出品！《大模型基础》教材已开源！附PDF文档_大模型基础pdf

这本浙大出品的大模型基础入门书籍：《大模型基础》你绝对不能错过！本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章，深入探讨了大模型的工作原理和使用方法-一提示工程，并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用，以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例，无论您是技术领域的专业人士，还是对新兴技术充满好奇心的读者，希望本书能激发您的思考，并为您展示一个崭新的创作世界。

2025-05-07 22:00:49 552

原创多模态模型痛点全解决！这两篇论文太硬核了

多模态大语言模型（MLLMs）是当前AI领域的重要研究方向，它通过整合文本、图像、音频等多种模态数据，显著提升了人机交互的自然性和应用广度。例如，在智能客服场景中，模型可同时解析用户的语音和文字信息以更精准地理解需求；在内容创作领域，则能基于图片自动生成匹配的文案。然而，该技术的发展仍面临若干关键挑战：**高质量多模态数据稀缺且标注成本高昂，导致训练样本不足；模型存在生成内容与事实不符的"幻觉"问题；多模态信息融合效率有待提升。**这些因素共同制约着模型的性能和实际应用效果。

2025-04-24 14:55:33 948

原创 99%的人都应该看看这本书-《多模态大模型算法、应用与微调》，看完你就是LLM大师！

详细介绍了先进的深度学习模型，包括Transformer、GPT系列、深度生成模型，从基本架构、训练方法到特定应用，包括但不限于Seq2Seq结构、位置编码、注意力机制、残差连接、变分自编码器、GAN、ViT、CLIP、Stable Diffusion、各模型训练实践的知识点。此外，探讨了预训练模型的涌现能力、模型参数和通信数据量的估算，以及分布式训练的各种技术，如数据并行、模型并行和混合精度训练等。

2025-04-24 14:49:31 937

原创 2025，我（普通人）学习大模型的方法和步骤

自从今年年初DeepSeek火了之后，每个公司估计都或多或少的准备了解和积累大模型知识了。我们公司也不例外，领导安排大家每天都要花一小时来学习大模型，每周大家聚在一起总结一次经验。一开始，我对大模型的认知，是停留在ChatGPT的使用上，只知道大模型可以对话聊天，像一个真人，感觉很神奇，但是不知道是怎么实现的。也听说过一些名词，比如神经网络、向量、卷积、权重之类的，也不敢和别人深聊，因为都不知道是什么意思，感觉是很深的数学知识和科学知识。

2025-04-23 22:50:59 988

原创初探大模型成功的关键，到底谁能做好大模型？_大模型数据

AI大模型需要大规模、高质量数据，而数据的高效处理方式是大模型成功的关键，因此为应用程序迅速提供数据的能力至关重要。随着AI应用场景日趋复杂化，我们需要了解数据访问模式并采取合适的解决方案。支付宝是全球最大的移动支付平台之一，服务13亿个人用户和8000万商户。为了给用户提供最佳体验，支付宝依靠机器学习模型来支持各种功能，如欺诈检测、风险评估和个性化推荐。然而，随着支付宝用户群和交易量的增长，公司开始在模型训练方面遭遇挑战。计算和存储性能之间的差异导致模型训练缓慢且效率低下。

2025-04-23 22:45:15 726

原创年薪百万招兵买马，拼多多杀入大模型，时代变迁，大模型时代来临

拼多多已经成立了一个数十人的大模型团队，团队位于上海。大模型团队将探索大模型在拼多多客服、对话等场景下的应用，且会拓展至其旗下跨境电商平台TEMU智能客服、搜索、推荐等业务场景。目前，整个进程仍处于研发阶段。行业分析人士认为，拼多多的大模型将为其电商体系进行服务，包括在AI导购、商品图片智能生成等方面的应用。拼多多已经通过官网，以及其他招聘渠道，开始在大模型领域招兵买马，有关大模型职位的年薪百万不在少数，最高将近130万元。图注：拼多多官网和BOSS直聘上，大模型相关岗位的招聘截图。

2025-04-16 23:17:15 840

原创漫画趣解：大模型预训练、后训练、微调

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用如果你是零基础小白，想快速入门大模型是可以考虑的。一方面是学习时间相对较短，学习内容更全面更集中。二方面是可以根据这些资料规划好学习计划和方向。包括：大模型学习线路汇总、学习阶段，大模型实战案例，大模型学习视频，人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型！😝有需要的小伙伴，可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓。

2025-04-16 23:06:28 919

原创 AI时代新机遇：为什么你应该学习大型模型应用开发？

人工智能大潮已来，不加入就可能被淘汰。就好像现在职场里谁不会用PPT和excel一样，基本上你见不到。你问任何一个人问他会不会用PPT，他都会说会用，只是说好还是不好。你除非说这个岗位跟电脑完全无关。但凡说能用上电脑的，基本上都会用excel和PPT，你不会用的基本上都被淘汰了，逻辑一样。人工智能虽有一些应用场景，好像跟普通人没关。如智能驾驶，人脸识别，好像跟普通人关系不太大，我们都是被动使用。但现在这大模型跟我们每个人都有关，它是一个强大提升工作效率工具。你不会用，将来就好像跟PPT和excel一样，

2025-04-11 22:42:56 920

原创为什么 MCP + A2A 可能是自互联网以来软件领域的最大变革？

今天，软件构建方式发生了一些重要变化，而大多数人没有注意到。Google 宣布的 Agent-to-Agent（A2A）协议，不仅仅是 AI 架构的又一次小幅升级。这标志着一种变革的初步开始，这种变革可能会结束过去七十年软件设计的传统方式——从确定性编程转向能够自主发现、适应和协作的系统。这种变化并非凭空而来。它建立在另一个同样重要的进展基础上：模型上下文协议（MCP），这是一种新的 AI 系统理解和使用工具的方式。

2025-04-11 22:39:50 600

原创大模型算法工程师经典面试题————为什么现在的主流大模型都是 decoder-only 架构？

本人是某双一流大学硕士生，也最近刚好准备参加 2024年秋招，在找大模型算法岗实习中，遇到了很多有意思的面试，所以将这些面试题记录下来，并分享给那些和我一样在为一份满意的offer努力着的小伙伴们！！！为什么现在的主流大模型都是 decoder-only 架构？相比encoder-decoder架构，只使用decoder有什么好处吗？

2025-04-08 18:18:23 703

原创强化学习+ RAG：从基础到优化的完整实现

在本篇博客中，我们将通过使用我们自己的强化学习（RL）奖励系统来改进我们最简单的检索增强生成（RAG）模型的实现，从而将事实性查询的检索质量从53%提升到84%。我们将从头开始编写所有代码，包括强化学习算法，且不使用任何Python库。原文地址：https://levelup.gitconnected.com/maximizing-simple-rag-performance-using-rl-in-python-d4c14cbadf59。

2025-04-08 18:14:05 658

原创全网跪求的AI圣经！浙大《大模型基础》PDF遭疯传，网友：比李沐还细！

这本浙大出品的大模型基础入门书籍：《大模型基础》你绝对不能错过！本书包含语言模型基础、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六部分内容。本书共9章，深入探讨了大模型的工作原理和使用方法-一提示工程，并研究了提示工程在电子商务、创意营销、内容创作、办公和编程等场景中的应用，以及如何赋能软件生态的发展等。本书旨在帮助读者了解提示工程的应用场景和实践案例，无论您是技术领域的专业人士，还是对新兴技术充满好奇心的读者，希望本书能激发您的思考，并为您展示一个崭新的创作世界。

2025-04-01 23:11:52 686

原创使用 Ollama 本地模型与 Spring AI Alibaba 的强强结合，打造下一代 RAG 应用

Spring AI：Spring 生态的 Java AI 开发框架，提供统一 API 接入大模型、向量数据库等 AI 基础设施。Ollama：本地大模型运行引擎，大模型时代的 Docker，支持快速体验部署大模型。Spring AI Alibaba：Spring AI 增强，集成 DashScope 模型平台，快速构建大模型应用。Elasticsearch：向量数据库，存储文本向量化数据，支撑语义检索。数据加载与清洗：从外部知识库加载数据，向量化后存储到 Elasticsearch。

2025-04-01 21:50:21 835

原创学大模型建议：大家有空可以多去GitHub学大模型❗—这个LLM知识库傻子都能看懂

🌟 大模型学习太难？别怕！这个仓库帮你从零基础到面试通关！ 🌟无论你是技术小白还是求职达人，这里都有适合你的学习资料！从基础概念到高级应用，再到面试真题，一站式搞定大模型学习！💡

2025-04-01 18:21:32 219

原创复旦NLP团队发布80页大模型Agent综述，一文纵览AI智能体的现状与未来

本文综述了基于大型语言模型（LLM）的智能体研究进展。LLM因其多功能性被视为通用人工智能（AGI）的潜在火花。文章追溯了智能体概念的起源，阐述了LLM作为智能体基础的优势，并提出了包含大脑、感知和行动的通用框架。同时，探讨了LLM智能体在单智能体、多智能体和人机协作等场景下的应用。最后，深入研究了智能体社会，讨论了其行为、人格和社会现象，并指出了该领域的关键问题和未来方向。

2025-03-28 23:20:07 821

原创首发！59页 |《2025私域大模型部署白皮书》，人人必备的大模型部署白皮书！（附PDF）

今天给大家推荐一本超实用的专有领域大模型部署白皮书-《2025年私域部署大模型白皮书》，它以"开箱即用"的极致体验破解 AI 落地 " 最后一公里 " 的痛点。这本白皮书让AI大模型不再是科幻片里的幻想，而是实实在在改变企业运营的神器。企业对智能化转型的需求越来越迫切，私域大模型凭借其强大的通用性和泛化能力，成为企业智能化转型的重要基石。数据安全与隐私保护是重中之重，私有化部署成为确保数据安全的必然选择。部署流程涵盖需求分析、数据治理、模型选型、系统部署、测试验证与持续运营等环节，每一步都至关重要。应用场

2025-03-28 18:47:23 222

原创打造个人AI大模型：本地电脑部署全攻略_本地部署ai大模型

现在的ai很多，让我看得有些眼花缭乱，随着ai的发展，现在已经有很多ai的大模型已经支持开源，所以现在支持部署一个大模型在自己电脑上，数据私人化。如果不知道自己是否需要或者是否合适配置可以跳到本文的结尾查看小编的使用感受。

2025-03-27 23:23:05 510

原创 2025神仙级AI大模型入门教程(非常详细)，从零基础入门到精通，从看这篇开始！_ai新手入门教程

大模型的学习不仅能够提升你的技术能力，还能够帮助你更好地理解数据科学和人工智能的原理。随着大模型在各个行业的应用越来越广泛，掌握这一技术将为你提供更多的职业机会。从科学研究到商业应用，从金融服务到医疗保健，大模型正在成为推动创新和效率提升的关键因素。学习大模型不仅是因为它们在当今和未来的技术领域中占据重要地位，更是因为它们有能力解决复杂问题并创造新的可能性。

2025-03-27 23:21:32 1020

原创体验实在Agent，这才是当前形成生产力的企业级通用智能体

首先，要有专属的企业知识库。企业在生产经营中积累了大量文档和数据，这些是企业独有的宝贵资产，也是员工真正需要的知识。通用大模型无法涵盖这些内容，因此企业需要沉淀自己的知识库并具备数据分析能力，以实现落地应用。其次，要有专属的业务系统操作指南。经过30多年的信息化建设，企业内部已有多套系统，每套系统都有独特的业务特性和操作流程。智能体要实现自动化业务办理，必须理解这些系统的操作规范，根据企业的业务流程来指导其操作。第三，要支持模型的接入。大模型能力不断进化，企业需要根据自身业务特性选择并接入适合的大模型。

2025-03-25 14:36:58 985

原创【重磅发布】中科院发布了DeepSeek满血版全参数微调指南，本地化部署和微调的权威参考来了！

💡 超强调参指南推荐！在大模型应用快速发展的背景下，如何高效地进行本地化部署，让企业和研究机构能够在自有算力环境中稳定运行和微调大模型，成为当前的技术挑战。DeepSeek-V3/R1 671B 满血版的全参数微调方案，正是针对这一痛点，由中国科学院自动化研究所与中科闻歌联合推出的一份完整的开源指南（DeepSeek-671B-SFT-Guide），涵盖从训练到推理的完整代码与脚本，为有本地化部署需求的团队提供了从训练到推理的全流程方案，总结了关键的优化策略和实践经验！

2025-03-25 14:32:44 406

原创智能客服搭建实战篇

下面以一个企业数字化服务的咨询公司的智能客服为例，介绍To B智能客服如何搭建。广义上来说，To C企业的智能客服应用更广，尤其是在售前咨询和售后争议解决方面，在数量级、AI场景丰富程度、SOP流程上都有更广的空间，但由于过往经验的限制（主要是知识库数据隐私限制），目前仅以To B企业数字化服务的咨询公司的智能客服来举例说明。

2025-03-22 17:52:25 847

原创 Java程序员转型大模型应用开发：掌握这12步就够了！

一、明确核心定位：发挥Java的工程化优势1. 专注大模型能力封装与集成Java程序员的核心竞争力在于企业级系统架构能力。应重点将大模型作为“工具”嵌入现有业务系统，例如：

2025-03-22 17:49:51 1322

原创 RAG知识库智能问答系统搭建（已脱敏）-基于大模型的知识库与知识图谱问答系统

基于大模型 RAG 知识库的知识图谱问答系统。大模型适配 OpenAI、国内主流大模型平台的模型调用、本地 vllm 部署。支持推理模型DeepSeek-R1、联网检索。🤖 多模型支持：适配 OpenAI、各大国内主流大模型平台，以及本地 vllm 部署📚 灵活知识库：支持 PDF、TXT、MD 等多种格式文档🕸️ 知识图谱集成：基于 Neo4j 的知识图谱问答能力🚀 简单配置：只需配置对应服务平台的 API_KEY 即可使用。

2025-03-22 10:33:54 622

原创熬了几个夜，终于让Agentic RAG工作流正常运行了，特来分享一下

***一直以来都在想用 LLM + Agent + RAG + FastAPI 搭建一套完整的智能检索增强生成工作流（Agentic RAG Workflow）。我选择了一个客服支持项目来学习，经过一段时间的学习（主要是踩坑），大致上是跑通了这个工作流。赶紧总结分享起来。Agentic RAG（代理型 RAG）只是与 AI 智能体架构一起使用的 RAG（检索增强生成）。使用传统 RAG 和 Agentic RAG，我们都可以使用 RAG Pipeline 填充搜索索引。

2025-03-22 10:21:52 910

原创 2025年AI 时代，程序员的出路在何方？

现在的 AI 大致是汽车的自动挡或者辅助驾驶阶段，更多的作为一个提效助手。不要抱怨 AI 的不完美，正是 AI 的不完美，我们不那么容易被淘汰。在大家都用大模型的情况下，多去发现更多应用场景，多去掌握提示词技巧，发挥大模型的价值，在 AI 逐渐普及的今天，多去培养和加强人相对于 AI 更有价值的能力，持续学习，才能在这个时代获取更多的优势。你认为 AI 时代，我们如何抓住这个风口？我们还需要增强哪些能力？

2025-03-21 10:39:58 587

原创【RAG技术实战】-- 18种RAG技术测评（part1-11种方法对比）

首发Tableau这几天一直想做一个工作测试所有rag的效果，但是鉴于不同框架实现可能导致效果评测有差异。这两天偶然发现一个满自身项目研究分许的宝藏项目。作者从一个简单的RAG方法开始，然后测试更高级的技术，如CRAG、Fusion、HyDE等等！为了保持简单，作者没有使用LangChain或FAISS。而是只使用基础库以编写所有技术，以保持简单和易于学习，是非常不错的学习资料，这里简单学习整理，也记录下来分享给大家。代码库组织如下：对于，作者使用来测试一个小型LLM在RAG任务中的表现。对于。

2025-03-21 10:37:40 631

原创书籍推荐：《从零构建大型语言模型》附免费PDF下载_从零构建大语言模型 pdf

通过从头开始**构建一个大型语言模型，了解如何创建、训练和调整大型语言模型（LLMs）

2025-03-17 23:57:05 1102

原创 LLM大模型基础入门：从头开始编写LLM代码

让我们回到多头注意力图。有了输入嵌入 X，我们可以开始实现多头注意力模块。实现多头注意力模块需要一系列步骤。让我们一一编码。

2025-03-17 23:54:48 628

原创 2025中国AI Agent行业研究报告｜附43页文件下载

AI飞速发展的时代，Deepseek的出现更是加速了大模型能力进化，AI Agent在大模型能力升级的推动下实现从任务执行者（copilot）向决策主体的跨越，并能够通过传感器感知其所处的环境，根据其内部状态和预设的目标，通过执行器对环境进行影响，Manus的出现让中国AI Agent迎来自己的GPT时刻。中科视语的视语坤川智能体应用平台、卓世科技的璇玑玉衡大模型及AI家庭医生服务智能体、斑头雁的BetterYeah AI Agent开发平台在此背景下应运而生。

2025-03-14 22:42:58 820

原创想转行进入 AI 领域，能通过哪些途径来实现？_ai行业怎么入行

• 能够完成时下热门大模型垂直领域模型训练能力，提高程序员的编码能力：大模型应用开发需要掌握机器学习算法、深度学习框架等技术，这些技术的掌握可以提高程序员的编码能力和分析能力，让程序员更加熟练地编写高质量的代码。• 基于大模型和企业数据AI应用开发，实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能，学会Fine-tuning垂直训练大模型（数据准备、数据蒸馏、大模型部署）一站式掌握；这种项目最好是所有代码都开源的项目，这样你就能从头开始学习一个大模型的构建，大模型的。

2025-03-14 22:37:32 874

原创 2025年的风口！| 万字长文，带你纵观大模型Agent，涉及研究痛点、应用场景、发展方向

最近大家都在提Agent，例如AutoAgent、Dify、Manus等，突然想到一个问题，那么什么才是Agent，有没有明确的定义呢？为此关于Agent的定义，网上搜索了一圈，说其最早“Agent”这个词可以追溯到古罗马时期，并且还能够从一些哲学家的哲学作品找到影子。一篇文章中说Agent的哲学概念泛指具有自主性的概念或实体，它可以是人造的物体，可以是植物或动物，当然也可以是人。这定义挺好的，我没意见。感兴趣的小伙伴可以就这个定义去搜索了解一下，把故事线梳理清楚了可以整篇论文了。

2025-03-13 23:44:55 1330

原创写给LLM新手的建议，让你少走2年弯路！

大模型的爆火，在全球范围内引发了一场A1“狂也在业界点燃了一场百模大战。结合蕞近飙”，两年我在大模型领域的一些经验，分享一下在校学生/新人如何转到大模型阵营。

2025-03-11 21:17:14 1727

空空如也

空空如也