Quest for Knowledge-CSDN博客

原创揭秘 DeepAgents 源码：打造具备企业级能力的 AI 智能体核心架构

在大模型应用开发中，从零构建一个具备文件操作、子 Agent 协作、上下文管理、容错修复等全维度能力的智能体（Agent），往往需要大量的底层封装和踩坑。而 DeepAgents 框架正是为解决这一痛点而生 —— 它基于 LangChain/LangGraph 生态，通过高度封装的中间件体系，让开发者一行代码就能创建出具备生产级能力的 “深度 Agent”，无需重复造轮子。

2026-01-14 11:08:44 1365

原创 DeepAgents到底是什么？一篇看懂LangChain新框架

DeepAgents是LangChain推出的新框架，专注于解决复杂AI任务处理中的核心痛点。它通过三大核心能力提升AI助手的表现：1）任务规划（write_todos工具），将复杂任务拆解为有序步骤；2）文件系统管理，提供临时/本地/云端三种存储方式记录中间信息；3）子Agent机制，实现专业任务分工协作。相比传统AI框架，DeepAgents特别适合处理多步骤、长周期的复杂任务，如行业调研、投资分析等场景，有效避免了传统AI在复杂任务中容易出现的步骤混乱、信息丢失等问题。

2026-01-09 15:26:59 1803

原创 ChromaDB调用BGE模型的两种实践方式

在语义搜索、知识库构建等场景中，文本向量化（Embedding）是核心技术环节。作为一款开源的向量数据库，ChromaDB允许开发者通过自定义嵌入函数灵活对接各类模型。本文将详细介绍两种基于BGE模型的实现方案：远程API调用与本地模型部署，并解析它们的应用场景与实现细节。

2025-05-07 15:23:07 1399

原创 SGLang、LMDeploy、vLLM、Ollama 集成部署DeepSeek系列模型

DeepSeek作为当前领先的开源大模型体系，其V3和R1系列模型凭借强大的自然语言处理能力和灵活的架构设计，已成为企业智能化转型的重要基础设施。

2025-04-11 10:14:43 2760

原创 DB2数据库专用python库--ibm_db

对 IBM Db2 for LUW 和 IBM Db2 for z/OS 的 Python 支持Python、适用于 IBM Db2 for LUW 和 IBM Db2 for z/OS 的 DB-API 组件提供用于连接到 IBM Db2 for LUW 和 IBM Db2 for z/OS 的 Python 接口ibm_db是Python连接IBM DB2数据库的核心驱动包，支持本地及远程数据库操作。

2025-04-09 17:29:30 1143

原创检索增强生成（RAG）进阶技术详解

RAG通过“外挂知识库”弥补了大模型的短板，成为企业落地AI的关键技术。未来，随着模块化设计、多模态检索等方向的发展，RAG将在更多场景中展现价值。开发者需紧抓数据质量、流程优化两大核心，让AI真正成为业务增长的引擎。知识局限性：LLM的训练数据具有时效性，无法覆盖实时信息（如2023年后的事件）或私有领域知识（如企业内部文档）。幻觉问题：模型可能生成看似合理但实际错误的内容，尤其在缺乏相关知识的领域。数据安全与隐私：企业不愿将敏感数据上传至第三方平台训练模型，需本地化知识库支持。

2025-03-27 17:30:33 1172

原创 Rerank详细介绍，助你快速理解

Rerank（重排序）是提升信息检索与生成系统精度的核心技术，尤其在RAG（检索增强生成）和大模型推理流程中起关键作用。简单来说，就是给搜索结果“二次打分”，把最相关的内容排到最前面。它像是一个“智能筛选器”，解决信息过载的问题，尤其在AI问答、搜索引擎等场景中至关重要。

2025-03-26 11:38:03 2313

原创 Agent实例，白话解说助你快速理解

Agent（智能体）是一种能够感知环境、自主决策并执行动作的智能实体。其本质是通过算法和模型模拟人类“思考-行动”的闭环过程，具备目标导向性和环境交互性。在人工智能领域，Agent特指基于大模型（如GPT、Qwen等）构建的智能程序，能够通过自然语言交互完成复杂任务。在本博客前三节进行白话解释其内容。自主性：无需人工干预，独立规划任务步骤（例如拆解“规划旅行”为查机票、订酒店等子任务）。工具调用能力：通过API连接外部工具（如地图、数据库），实现“动手操作”（如调用订票系统完成预订）。

2025-03-05 11:53:12 1334

原创 NPU、GPU、CPU 的核心区别与功能解析

NPU（Neural Processing Unit，神经网络处理单元）、GPU（Graphics Processing Unit，图形处理单元）和CPU（Central Processing Unit，中央处理器）是计算机中用于执行不同类型计算任务的三种主要处理器。CPU：作为计算机的核心组件，CPU负责执行操作系统、应用程序以及处理输入输出请求等大多数基本指令。它被设计为通用处理器，可以高效地处理各种类型的任务，但其并行处理能力相对有限。GPU：最初设计用于加速图形渲染过程，特别是3D图形。

2025-02-26 15:43:32 5418

原创大模型本地部署硬件资源学习（包含模型微调所需资源）

本博客将全面探讨构建系统的需求分析框架到深入解析华为昇腾算力的支持能力，再到提供详尽的显卡信息对比和大模型微调所需的显存资源指南。特别针对Qwen系列与DeepSeek蒸馏模型，将详细介绍其微调显存需求、优化策略及硬件选型建议。

2025-02-24 16:29:09 6416

原创大模型微调解读及参数设置实践示例

大模型微调，简单来说，就是拿一个已经训练好的“基础（Base）大模型”（比如BERT、Qwen、deepseek这些大家伙），然后根据你的具体任务，再稍微训练一下，让它更懂你要做的事情。你可以把它想象成一个已经学了很多知识的学生，现在你只需要再教它一些特定的技能，它就能在你需要的任务上表现得更好。例子：假设你有一个已经学会了各种语言知识的AI模型（比如BERT），现在你想让它专门做“情感分析”，就是判断一句话是正面的还是负面的。

2025-02-20 11:01:25 4590

原创让人记忆深刻的Transformer学习，一遍就能看懂

本文将先着重介绍1：Embedding、2：Positional Encoding、3：Attention和Multi-Head Attention。最终口语化的展示Transformer整体原理。以下是Transformer的架构图。

2025-02-19 14:44:49 931

原创 DeepSeek全方位解读：模型介绍，优势及应用场景

在当今快速发展的科技世界里，人工智能（AI）已经成为推动社会进步和创新的关键力量。从智能家居到自动驾驶汽车，再到复杂的数据分析与预测模型，AI的应用无处不在，并不断拓展着人类认知和技术实现的边界。而在众多引领这场智能革命的企业和研究机构中，DeepSeek以其独特的核心技术和前瞻性的研究方向脱颖而出，成为行业内外关注的焦点。本文旨在为读者提供一个深入了解DeepSeek的机会。DeepSeek是一家中国人工智能初创公司开发的大型语言模型和AI助手。

2025-02-12 10:51:37 22166 1

原创大模型训练参数量计算

在现有的大模型训练方案中，通常会采用混合精度训练，模型参数和模型梯度通常以 16 位浮点数存储，而 Adam 或 AdamW优化器则需要额外存储 32 位浮点数的模型参数、动量参数以及动量二阶矩参数。大语言模型的参数量取决于多个关键因素，包括词表大小（𝑉）、解码器层数（𝐿）、中间状态维度（𝐻）、以及前馈网络层的中间维度（𝐻′）。假设模型的参数量为 𝑃，训练中配备有 𝐺 张 GPU，训练的数据并行数为 𝑁𝐷，流水线并行数为 𝑁𝑃，张量并行数为 𝑁𝑇。归一化层：每层2𝐻参数，外加最后一层的𝐻参数。

2024-12-23 10:08:24 2231

原创 RAG基础知识及综述学习

大型语言模型（LLM）在众多领域内取得了显著成就，这主要归功于它们通过大量参数来存储和处理知识的能力。然而，即便如此，LLM依然面临一些关键挑战，比如产生不准确或虚构的信息（幻觉问题）、难以及时更新内部知识以反映最新信息（知识更新问题），以及缺乏对特定领域的深入理解。检索增强生成（RAG）作为一种新兴技术，通过引入外部知识库来强化LLM的功能，有效地缓解了上述问题。本文全面介绍了RAG的核心技术，特别是检索组件和如何将检索到的信息与生成过程相结合的策略。

2024-12-20 10:52:19 1190

原创 Text2SQL连接数据库的实践细节及示例代码

随着自然语言处理（NLP）技术的不断进步，将自然语言转化为SQL查询语句的能力逐渐成为现实，这为非技术人员直接与数据库进行交互提供了可能。Text2SQL作为一个新兴的研究领域和技术应用，旨在通过解析用户输入的自然语言问题，并将其转换成相应的SQL查询语句，从而实现对数据库的智能查询。本博客将深入探讨Text2SQL连接数据库的实践细节，涵盖从自然语言查询内容的解析到最终查询结果展示的整个流程。我们将详细介绍如何统计数据查询，包括涉及的数据库及表范围划定、权限设置、防护栏语句设定等重要环节；

2024-12-17 11:27:55 3340

原创深入了解Text2SQL开源项目（Chat2DB、SQL Chat 、Wren AI 、Vanna）

在数据驱动决策的时代，将自然语言查询转化为结构化查询语言（SQL）的能力变得日益重要。无论是小型创业公司还是大型企业，都希望能够更轻松地从海量的数据中挖掘出有价值的见解。然而，对于那些不熟悉SQL或者数据库架构的用户来说，直接编写复杂的查询语句往往是一个巨大的挑战。正是为了解决这一问题，Text2SQL技术应运而生，它允许用户通过简单的自然语言描述来获取他们所需的数据库信息。近年来，随着人工智能和机器学习领域的迅速发展，Text2SQL技术也取得了显著的进步。

2024-12-12 14:20:33 14593 1

原创 Text2SQL（NL2sql）对话数据库：设计、实现细节与挑战

随着信息技术的迅猛发展，人机交互的方式也在不断演进。在数据驱动的时代背景下，用户对信息查询和数据分析的需求日益增长。传统的数据库查询语言如SQL（结构化查询语言），虽然功能强大且高效，但因其语法复杂、门槛较高，限制了非技术人员直接与数据库进行交互的能力。为了弥合这一差距，Text2SQL（或称NL2SQL，自然语言到SQL）技术应运而生。Text2SQL旨在将用户的自然语言问题转换为等价的SQL查询语句，使数据库能够理解和响应人类语言形式的请求。

2024-12-09 16:43:56 8298

原创 AI编程辅助工具：CodeGeeX 插件使用

CodeGeeX 是一款基于 AI 技术的编程助手插件，旨在帮助开发者提高编程效率和代码质量。它能够智能生成代码、优化现有代码、自动生成文档以及回答编程相关的问题。无论您是初学者还是资深开发者，CodeGeeX 都能成为您宝贵的编程伙伴。它可以实现代码的生成与补全、自动为代码添加注释、自动解释代码、自动编写单元测试、实现代码审査CodeReview、自动修复代码fixbug、自动生成commit message完成gi提交，以及在不同编程语言的代码间实现互译、针对技术和代码问题的智能问答等丰富的功能。

2024-08-12 17:04:37 3079 1

原创利用PaddleOCR进行图片的跨页表格提取与合并（PDF扫描版）

在处理PDF文件中的表格时，常常会遇到表格跨页的情况。并且一些PDF文件为扫描版。这种情况下，如果要将跨页的表格合并为一个完整的表格，手动操作不仅繁琐且容易出错。因此，本文将介绍如何利用PaddleOCR和Python代码，自动化地检测并合并这些跨页表格。这些辅助函数用于提取PDF页面中的表格信息，并判断表格是否跨页。top_bottom_table_info：获取页面中最上方表格的列数和坐标。find_bottom_table_info：获取页面中最下方表格的列数和坐标。

2024-07-12 11:14:59 3862 1

原创使用Python自动识别和合并PDF中的跨页表格

在处理大量包含表格数据的PDF文档时，一个常见的挑战是这些表格可能跨越多页。手动合并这些表格不仅耗时，而且容易出错。幸运的是，通过使用Python和一些强大的库，我们可以自动化这一过程，有效地识别和合并跨页表格。这个函数接收一个PDF页面对象，使用pdfplumber库的find_tables()方法找到页面上的所有表格，并返回一个包含每个表格边界坐标的列表。每个表格的边界由一个四元组表示，包含左、顶、右、底的坐标。

2024-07-11 13:58:40 4385 4

原创 Python 实现Word文档中提取表格数据并转换为CSV和JSON格式

在日常工作中，我们经常需要处理大量的Word文档，其中包含各种表格数据。手动整理这些表格不仅耗时且容易出错。因此，开发一个自动化工具来解析Word文档中的表格，并将其转换为更易于处理的CSV或JSON格式，可以极大地提高工作效率。通过这个脚本，可以轻松地从Word文档中提取表格数据，并将其转换为CSV或JSON格式，从而方便进一步的数据分析或导入到数据库中。节省了手动数据录入的时间，还减少了人为错误的可能性，提高了数据处理的效率和准确性。

2024-07-11 11:19:59 2158

原创大模型学习（常见名词、基础知识）

自图灵测试问世以来，人类便致力于让机器掌握语言智能，这一目标驱动着人工智能（AI）算法的持续发展。语言模型作为理解与生成自然语言的核心技术，经历了从统计语言模型（SLM）到神经语言模型（NLM）的演进，最终催生了基于Transformer架构的预训练语言模型，尤其是大语言模型（LLM）的崛起。与传统的统计语言模型依赖马尔可夫假设不同，现代的神经网络模型，如BERT和GPT系列，通过深度学习捕捉复杂的语言规律。

2024-06-27 16:57:48 1985

原创 Python 语音识别系列-实战学习-DFCNN_Transformer的实现

此博客是基于华为云中的DFCNN_Transformer的教程进行的学习和实践。本文将介绍一个结合了深度全卷积网络（DFCNN）和Transformer的模型——DFCNN-Transformer，旨在提高中文语音识别的准确性和效率。注意该代码主要改进之处为将原先的TensorFlow-1.13.1版本的代码改进为TensorFlow-2.0+版本。以方便大家进行代码的实践。首先加载需要的python库import os定义声学模型。

2024-04-30 10:30:59 1675 3

原创 Python 语音识别系列-实战学习-语音识别特征提取

语音识别特征提取是语音处理中的一个重要环节，其主要任务是将连续的时域语音信号转换为连续的特征向量，以便于后续的语音识别和语音处理任务。在特征提取阶段，这些特征向量能够捕捉到语音信号中的关键信息，如音调、音色和音节等。时域特征提取：包括自相关函数、方差、峰值等。频域特征提取：如傅里叶变换、快速傅里叶变换、波束傅里叶变换等。时频域特征提取：包括短时傅里叶变换、波形分解、时频图等。高级特征提取：涉及语言模型、语音模型、语音合成等。在具体实践中，语音特征提取的方法和技梅尔频率倒谱系数 (MFCC)

2024-04-28 11:17:04 4810 1

原创 Python 语音识别系列-实战学习之初识语音识别

在本篇博客中，将介绍语音识别的基础知识，包括其定义、工作原理以及如何使用 Python 进行简单的语音识别。随着人工智能技术的迅猛发展，语音识别已成为日常生活中不可或缺的一部分，从智能助手到自动客服系统，语音技术正变得越来越普及。语音识别，也称为自动语音识别（ASR），是将人类语音转换为文本的过程。这项技术利用算法解析语音信号，并将其转换为文字信息。语音识别技术可以使设备理解和响应用户的语音指令，从而提供更为直观和便捷的用户交互方式。

2024-04-25 10:13:21 2629 4

原创深度学习系列-python实现-初步学习构建神经网络

在数字时代，数据已经成为了一种无处不在的资源。从商业分析到科学研究，从人工智能到机器学习，数据驱动的决策和预测已经成为了各行各业不可或缺的一部分。而在这一切的背后，神经网络和深度学习技术发挥着至关重要的作用。深度学习神经网络，是模拟人脑神经元连接和工作方式的一种计算模型。它们通过训练大量数据来学习和优化自身，从而能够处理复杂的模式和进行精确的预测。近年来，随着计算能力的提升和大数据的普及，深度学习已经在语音识别、图像识别、自然语言处理等领域取得了显著的突破。

2024-04-02 11:50:08 1319 2

原创 python 实现集成学习与随机森林（机器学习）

首先，导入几个常用模块，确保MatplotLib绘制图形，并准备一个保存图形的函数。还要检查是否安装了Python 3.5或更高版本(尽管Python 2。x可以工作，它已被弃用，因此建议使用Python 3代替)，以及Scikit-Learn≥0.20。

2024-03-08 10:05:38 999 1

原创 matplotlib全面教程

Matplotlib可以使用各种后端图形库(如Tk, wxPython等)输出图形。当使用命令行运行python时，图形通常显示在单独的窗口中。在Jupyter笔记本中，可以通过运行%matplotlib inline magic命令在笔记本本身中输出图形。更多了解可到Matplotlib官网进行学习。

2024-03-06 11:30:35 1619 2

原创 pandas的介绍和学习

pandas库提供了高性能、易于使用的数据结构和数据分析工具。主要的数据结构是DataFrame，您可以将其视为内存中的2D表(类似于电子表格，具有列名和行标签)。Excel中的许多功能都可以通过编程实现，例如创建数据透视表、基于其他列计算列、绘制图表等。还可以按列值对行进行分组，或者像在SQL中那样连接表。pandas在处理时间序列方面也很出色。先决条件:已了解NumPy -如果你不熟悉NumPy，建议先去学习NumPy教程。本教程适合在jupyter中运行。

2024-03-05 15:33:38 1356

原创 NumPy的学习，常用方法详解

NumPy是用Python进行科学计算的基础库。NumPy以一个强大的n维数组对象为中心，它还包含有用的线性代数、傅立叶变换和随机数函数。

2024-02-29 11:13:18 1396 1

原创 NLP 使用词嵌入来表示文本

词嵌入词嵌入提供了一种使用高效、密集表示的方法，其中相似的单词具有相似的编码。该方法不需要手动指定编码。嵌入是浮点值的密集向量（向量的长度是你所指定的参数）。它们不是手动指定嵌入的值，而是可训练的参数（模型在训练期间学习的权重，就像模型学习密集层的权重一样）。通常可以看到 8 维的单词嵌入（对于小型数据集），在处理大型数据集时最多可达 1024 维。更高维度的嵌入可以捕获单词之间的细粒度关系，但需要更多的数据来学习。上图是单词嵌入的图表。每个单词都表示为浮点值的 4 维向量。

2024-02-20 10:21:43 1043 1

原创机器学习- K-Means聚类-mushroom dataset-蘑菇数据集 python scikit-learn

无监督学习- K-Means聚类K-Means聚类是一种无监督学习算法。在无监督学习中，机器学习模型在训练过程中没有得到标签。相反，它必须自己找出标签。K-Means聚类需要在训练前指定簇的数量。K-Means将随机分配数据样本到所有聚类的初始质心。这个步骤称为初始化。质心也被称为集群中心，它是集群中所有样本数据的平均值。然后将样本重新分配到最近的质心。通过取分配给每个先前质心的所有样本的平均值来找到所有簇的新质心。重复最后两个步骤，直到满足停止准则或新旧质心之差恒定为止。

2024-02-07 11:51:36 1229 1

原创介绍自然语言处理（NLP）中的文本处理—TensorFlow

智能机器不仅能看到世界，还能理解我们并与我们交谈。这一点也不夸张，其中虚拟助手互动，比如Siri、亚马逊Alexa和谷歌助手。在许多软件应用程序和网站上，我们与成千上万的聊天机器人进行互动。自然语言处理是一个跨学科的领域。它是计算机科学、机器学习和计算语言学的一个分支，涉及赋予计算机理解文本和人类语言的能力。NLP中常见的任务下面是一些可以用NLP完成的常见任务。文本分类情绪分析文本生成机器翻译语音识别文本到语音的转换光学字符识别自然语言处理的应用实例。

2024-02-07 09:20:10 1507 1

原创机器学习-决策树-分类-汽车数据集-fetch_openml python scikit-learn

在这个使用决策树的分类任务中，将使用OpenML提供的汽车数据集来预测给定汽车信息的汽车可接受性。将使用Sklearn ’ fetch_openml '函数加载它。此次获取的数据的版本是2。在数据集的版本1中，目标类有4个类(unacc, acc, good, vgood)，但在第二个版本中，大多数类是Positive§，而其余的是Negative§。如果要查看版本1，可以在下面的单元格中更改版本参数。以下是有关数据的信息:buying:汽车的购买价格(vhigh, high, med, low)

2024-02-06 14:43:07 2479 1

Python 语音识别系列-实战学习-DFCNN-Transformer的实现

机器学习系列- 房价数据

空空如也