抱抱宝-CSDN博客

原创一文详解LLM Agent

摘要： LLM Agent是基于大型语言模型的智能代理系统，能自主执行任务并与环境交互。主要类型包括任务型、对话型、工具增强型和多Agent协作系统。其工作流程涵盖感知输入、意图解析、工具调度、执行验证和输出生成。开发者可通过Python框架（如LangChain）构建基础Agent，并通过记忆机制、工具链扩展和安全管控增强功能。调试时可查看决策日志、拆解任务或通过示例修正行为。

2025-09-29 21:08:47 540

摘要： RAG（检索增强生成）是一种结合信息检索与文本生成的技术，通过实时检索外部知识库提升生成内容的准确性和时效性。其核心包括检索模块（稠密/稀疏检索）和生成模块（如GPT），协同工作实现动态知识融合。构建RAG需关注高效检索方法（如FAISS）、生成模型选择及数据对齐优化。实现时可用Hugging Face工具链，通过索引构建和端到端流程完成系统搭建，并调优检索参数与生成效果。RAG适用于需外部知识的场景，如开放域问答，解决了传统模型知识滞后问题。

2025-09-29 21:00:18 1042

原创大模型微调

大模型微调是在预训练模型基础上，通过特定任务数据调整参数使其适应下游任务，包括全参数微调和参数高效微调。监督式微调（SFT）利用标注数据，通过交叉熵损失反向传播更新参数，需注意数据质量、学习率策略和早停机制。参数高效微调方法主要有Adapter（插入小型全连接网络）、Prefix Tuning（添加可训练前缀向量）和LoRA（低秩矩阵分解）。全参数微调更新全部参数，适配能力强但计算成本高；部分微调仅更新少量参数，计算成本低且过拟合风险小。两种方法适用于不同场景，如大数据领域或资源受限任务。

2025-09-29 20:40:06 1160

原创 Prompt提示词（保姆级教程）

本文系统介绍了Prompt（提示词）的概念与应用。Prompt是引导AI生成特定输出的文本输入，广泛应用于内容创作、编程辅助、数据分析等场景。文章重点阐述了结构化Prompt框架，包括角色、任务、格式三要素，并详细解析了APE、CARE、RACE等9种进阶框架。还提供了讯飞星火、OpenAI等Prompt学习资源，涵盖从基础到高级的Prompt构建方法，帮助用户更高效地使用AI模型。

2025-09-10 16:12:58 867

原创 LLM的训练过程

大型语言模型（LLM）训练分为预训练（Pretrain）、有监督微调（SFT）和人类反馈强化学习（RLHF）三个阶段。预训练是核心阶段，使用海量无监督文本训练Decoder-Only架构模型，遵循Scaling Law确定模型参数与训练数据比例，需要大规模分布式计算资源（如Deepspeed框架的ZeRO优化策略）。数据清洗与质量对预训练效果至关重要。SFT阶段通过指令微调激发模型能力，训练指令遵循与多轮对话能力。RLHF阶段通过强化学习（如PPO算法）使模型输出更符合人类价值观，其中奖励模型（RM）评估回

2025-06-26 15:58:35 1181

原创大语言模型介绍

大语言模型（LLM）已成为NLP领域的新范式，其参数量级（十亿至千亿）和涌现能力远超传统预训练模型（PLM）。LLM的核心能力包括：上下文学习（无需微调）、指令遵循（泛化处理新任务）、逐步推理（解决复杂逻辑问题）以及多语言/长文本处理。典型代表GPT-3/ChatGPT通过三阶段训练实现突破，但也存在幻觉（生成虚假信息）等固有缺陷。当前研究正探索多模态扩展和缓解幻觉的方法，标志着大模型时代的全面到来。

2025-06-26 14:26:04 1263

原创预训练语言模型之：Encoder-only PLM

本文系统分析了BERT、RoBERTa和ALBERT三大Transformer编码器模型的演进。BERT通过双向预训练和MLM任务开创了语言模型新范式；RoBERTa优化训练策略，取消NSP并扩大数据量，显著提升性能；ALBERT采用参数共享和嵌入分解实现轻量化。三者各具优势：BERT通用性强，RoBERTa精度高，ALBERT效率突出。这些创新推动NLP技术在搜索、客服等领域的应用突破，展现了参数优化与训练策略改进对模型性能的关键影响。

2025-06-24 16:24:38 1090

原创 Transformer：现代自然语言处理的革命性架构

Transformer模型革新了自然语言处理，完全基于自注意力机制取代传统RNN结构。其创新架构包括：1)多头自注意力层并行处理长距离依赖；2)位置编码保留序列信息；3)残差连接和层归一化解决梯度消失；4)掩码机制实现序列生成。通过堆叠编码器-解码器结构，Transformer克服了传统序列模型的并行计算瓶颈，成为BERT、GPT等现代NLP模型的基石。实验证明，该架构在机器翻译等任务中表现出色，显著提升了训练效率和模型性能。

2025-06-21 19:04:23 886

原创注意力机制

注意力机制

2025-06-20 20:09:21 1043

原创文本表示的发展概述

文本表示是自然语言处理的基础技术，旨在将文本数据转化为计算机可处理的数字化形式。主要方法包括：向量空间模型（如词频TF-IDF）、N-gram语言模型（基于统计的概率模型）、Word2Vec词嵌入技术（包括CBOW和Skip-Gram两种架构）以及动态词向量ELMo。这些方法各有特点：传统向量模型简单高效但稀疏，N-gram面临数据稀疏问题，Word2Vec能捕捉语义关系但局限局部上下文，ELMo实现动态词向量但计算复杂度高。文本表示的质量直接影响后续NLP任务的效果，需要在语义保留和计算效率之间取得平衡。

2025-06-13 14:16:04 875

原创 transforms方法

Transforms是PyTorch中用于图像数据预处理的工具，主要提供数据增强功能来提升模型泛化能力。它支持将PIL图像或NumPy数组转换为Tensor进行处理后再转回PIL格式。常用变换包括：CenterCrop（中心裁剪）、RandomCrop（随机裁剪，可设置填充参数）、RandomResizedCrop（随机比例和大小裁剪）、FiveCrop（四角+中心裁剪）和TenCrop（生成10张镜像增强图像）。这些方法通过调整图像尺寸、比例和填充模式等参数，实现对训练数据的多样化增强，有效扩充数据集规模

2025-06-13 14:03:07 606

原创 NLP 基础概念

摘要：NLP（自然语言处理）是让计算机理解、生成人类语言的人工智能技术，涉及多学科交叉。其核心任务包括：中文分词（切分连续中文文本）、子词切分（解决词汇稀疏问题）、词性标注（标记单词词性）、文本分类（自动归类文本）、实体识别（提取人名地名等）、关系抽取（识别实体间语义关系）、文本摘要（生成内容概要）、机器翻译（跨语言自动翻译）和自动问答（理解并回答自然语言问题）。这些任务为语言技术发展奠定了基础，广泛应用于信息处理、知识图谱构建等领域。

2025-06-13 13:52:02 1192

原创 Git与GitHub：理解两者差异及其关系

什么是Git？Git是一个设计用来高效处理从小到大项目的分布式版本控制系统（DVCS）。它由林纳斯·托瓦兹于2005年为Linux内核的开发而创建。Git允许多个开发者同时在一个项目上工作，而不会覆盖彼此的更改。什么是GitHub？GitHub是一个提供软件开发和版本控制使用Git托管的基于Web的平台。它由汤姆·普雷斯顿-沃纳、克里斯·万斯特拉思、PJ·海特和斯科特·查孔于2008年创立，并于2018年被微软收购。GitHub为开发者提供了一个共享、审查和管理代码的合作环境。

2025-03-08 18:10:16 2174

原创 Pyecharts之图表组合与布局优化

在实际应用中，我们可以根据数据的特点和分析需求，灵活选择使用 Tab 组件、Page 组件或 Timeline 组件。Tab 组件适合用户切换查看不同类型的图表，Page 组件适合将多个图表排列在一起展示，而 Timeline 组件则适用于展示数据的时间序列变化。你可以根据需要调整每个图表的样式、数据和颜色，以满足不同的可视化需求。

2025-01-25 21:19:58 1966 1

原创 Pyecharts之词云图、面积图与堆叠面积图

通过这三个示例，我们可以看到 Pyecharts 在数据可视化方面的强大功能，无论是词云图对文本数据的精彩展示，还是面积图和堆叠面积图对数据趋势和分层关系的呈现，都为我们提供了多样化的数据展示手段。

2025-01-25 21:02:18 911

原创 Pyecharts之地图图表的强大功能

在实际使用中，GEO 地图添加自定义坐标是一个很有用的功能。# 假设我们要添加一个自定义地点的坐标，例如 "自定义地点"geo.add_coordinate("自定义地点", 120.00, 30.00)# 为自定义地点添加数据geo.add("自定义数据系列", [("自定义地点", 50)], type_="scatter")title_opts=opts.TitleOpts(title="GEO 地图添加自定义坐标示例"),return geo代码解释首先，我们导入Geo类和。

2025-01-25 21:00:55 1754

原创 Pyecharts之特殊图表的独特展示

象形图是一种使用自定义图形来表示数据的图表，比普通的柱状图更加形象生动。下面是# 使用自定义图形，这里使用 'circle' 作为示例"",y_data,symbol='circle', # 自定义图形为圆形title_opts=opts.TitleOpts(title="象形图自定义图形"),xaxis_opts=opts.AxisOpts(is_show=False), # 隐藏 x 轴yaxis_opts=opts.AxisOpts(is_show=False) # 隐藏 y 轴。

2025-01-25 21:00:02 1126

原创 Pyecharts之散点图的视觉扩展

在数据可视化中，散点图是一种强大的工具，可用于展示数据点在二维平面上的分布情况。通过添加各种视觉组件，我们可以让散点图变得更加丰富和具有表现力，更能反映数据的多维度特征。本文将详细解读如何为散点图添加不同的视觉组件，包括根据数据大小映射图形大小、同时映射图形大小和颜色，以及综合运用大小、颜色和透明度等多维度的视觉组件。

2025-01-25 20:42:05 1279

原创 Pyecharts之饼图与多饼图的应用

为了让饼图更具可读性和表现力，我们可以对数据标签进行自定义。使用# 自定义数据标签return pie代码解释首先，导入Pie类、options模块和Faker模块。创建Pie实例pie，并设置初始化选项，包括主题、宽度和高度。使用Faker生成一些假数据，通过列表推导式将选择的类别和对应的数值组合成元组列表，然后添加到饼图中。在方法中，使用label_opts来自定义数据标签。

2025-01-25 20:40:22 1443

原创 Pyecharts图表交互功能提升

通过上述示例，我们可以看到 Pyecharts 提供了丰富的交互功能，包括不同类型的缩略轴组件、图例交互效果。这些功能可以让用户更好地与图表交互，深入探索数据，并且增强数据可视化的视觉体验。在实际应用中，可以根据具体的数据和使用场景，灵活选择和组合这些交互功能，为用户带来更加优质的数据可视化服务。在后续的文章中，我们将继续探索 Pyecharts 的更多高级功能，敬请期待！

2025-01-25 20:32:59 882

原创 Pyecharts之图表样式深度定制

通过对图表样式的深度定制，我们可以根据不同的需求和场景，灵活运用线性渐变色、径向渐变色和分割区域，使图表更加生动、美观且易于理解。这些定制功能是 Pyecharts 强大功能的一部分，能让你在数据可视化的过程中展现出更具创意和专业的效果。在后续的文章中，我们将继续探索更多有趣的数据可视化技巧，帮助你进一步提升数据可视化能力。

2025-01-25 20:22:47 1236

原创 Pyecharts之双轴图表的魅力

在数据可视化的实践中，我们经常会遇到这样的情景：希望在一张图中展示不同量纲的数据，以便进行对比与关联分析。这时，双轴图表（双 Y 轴或双 X 轴）便可派上用场。通过 Pyecharts，我们可以轻松创建多轴图表，从而在同一个可视化中同时展示多种维度的信息。

2025-01-25 20:21:50 2004

原创 Pyecharts之折线图的灵活运用

有时候，默认的坐标轴标签可能无法完全满足您的需求。通过自定义坐标轴标签文本，可以实现标签的个性化展示，例如修改字体样式、颜色或旋转角度。下面我们将介绍如何实现这一功能，并将标签文本样式进行个性化设置。# 导入所需的库# 创建一个 Line 实例# 添加横坐标数据，例如年份# 添加纵坐标数据"利润（万元）",profits,linestyle_opts=opts.LineStyleOpts(width=4) # 设置线条宽度为4# 设置系列选项，包括显示数据标签。

2024-12-19 15:24:44 1028

原创 Pyecharts之柱状图的多样呈现

为了让柱状图更加清晰和易于理解，我们可以自定义数据标签，例如显示数据的具体值、百分比等信息，甚至可以对标签的样式进行调整。# 导入所需的库# 创建一个 Bar 实例# 添加横坐标数据bar_label_custom.add_xaxis(['类别 1', '类别 2', '类别 3'])# 添加纵坐标数据bar_label_custom.add_yaxis('数据系列', [80, 90, 100])# 设置系列选项，包括自定义数据标签。

2024-12-19 15:21:41 1114

原创 Pyecharts 入门与环境搭建

Pyecharts 是一个基于 Python 的开源数据可视化库，它封装了百度开源的 Echarts 库的功能，使得 Python 用户能够轻松地创建各种绚丽多彩、交互性强的图表。Echarts 本身是一款非常流行的可视化库，以其丰富的图表类型、流畅的动画效果和强大的交互能力而闻名。Pyecharts 将这些优秀特性引入到 Python 世界，让 Python 开发者无需深入学习前端知识，即可快速生成高质量的可视化图表。

2024-12-19 15:16:14 1783

原创集成学习之AdaBoost

是一种集成学习方法，它通过迭代地训练弱分类器并将它们组合成一个强分类器来提高模型的性能。AdaBoost的核心思想是每次迭代中赋予错误分类样本更高的权重，从而使得后续的弱分类器更加关注这些难分类的样本。AdaBoost可以应用于分类问题，尤其是二分类问题。本次案例分析使用的数据集包含了一系列工业机器的运行状态记录，包括机器编号、质量等级、工厂温度、机器温度、转速、扭矩、使用时长等特征，以及是否发生故障的标签。我们的任务是基于这些特征预测机器是否会故障。

2024-11-30 16:35:30 774

原创集成学习之XGBoost

XGBoost（eXtreme Gradient Boosting）是一种高效的梯度提升框架，它实现了梯度提升决策树（Gradient Boosting Decision Trees, GBDT），并在此基础上进行了优化。XGBoost在许多机器学习竞赛中表现出色，因其高效性和强大的预测能力而受到广泛欢迎。XGBoost支持多种目标函数和评估指标，可以处理回归、分类以及排名等问题。

2024-11-30 16:33:47 982

原创集成学习之梯度提升树

梯度提升树（Gradient Boosting Trees, GBT）是一种强大的集成学习方法，它通过迭代地添加弱预测模型来构建一个强预测模型。在每一轮迭代中，新的模型会试图纠正前序模型产生的错误。GBT可以用于回归和分类问题，并且在许多实际应用中表现优异。梯度提升树是一种非常有效的方法，尤其适用于处理复杂的数据模式。通过本文的介绍与案例分析，希望能帮助读者更好地理解这一算法，并能够在实践中加以运用。在未来的工作中，尝试不同的参数设置以及结合其他技术可能会带来更好的结果。

2024-11-28 14:36:24 1222

原创集成学习之随机森林

随机森林属于集成学习（Ensemble Learning）中的一种，它是通过构建多个决策树，并综合这些决策树的预测结果来进行最终的预测。就好比一群经验丰富的专家（各个决策树）共同商讨一件事，然后汇总大家的意见（预测结果）得出最终结论，往往这样综合考量后的结果会更加准确可靠。随机森林可以用于解决分类问题，比如判断一封邮件是垃圾邮件还是正常邮件；也能处理回归问题，例如预测某地区的房价走势等。准确性高：通过集成多个决策树，减少了单个模型的偏差和方差，通常能获得比单一决策树更好的预测性能。鲁棒性强。

2024-11-28 14:33:25 1093

原创机器学习之t-SNE降维

t-SNE是一种非线性降维技术，主要用于高维数据的可视化。由Laurens van der Maaten和Geoffrey Hinton于2008年提出，t-SNE通过将高维数据映射到二维或三维空间，保留数据的局部结构，使得在低维空间中的数据点分布能够反映出高维空间中的相似性与簇结构。t-SNE广泛应用于图像处理、自然语言处理、生物信息学等领域的数据探索与分析。t-SNE作为一种强大的非线性降维与可视化工具，在探索高维数据结构、揭示潜在模式方面展现出显著优势。

2024-11-23 13:44:29 1468 1

原创机器学习算法之主成分分析法（PCA）

主成分分析（PCA）是一种线性降维技术，旨在通过正交变换将高维数据投影到一个低维空间中，同时尽可能保留数据的主要信息。PCA通过找到数据中方差最大的方向（即主成分），将数据沿这些方向进行投影，从而实现降维。主成分分析（PCA）是一种强大的降维工具，通过线性变换将高维数据映射到低维空间，同时保留数据中的主要信息。在实际应用中，PCA不仅可以用于数据压缩和特征提取，还可以帮助我们更好地理解数据结构。希望通过本文的介绍和案例分析，能够让你对PCA有更深入的理解。

2024-11-23 13:42:53 3212

原创快速学会一个算法:K-means聚类

K-means 是一种简单且广泛使用的聚类算法，其目的是将数据集中的样本划分为 K 个聚类，使得每个样本都属于最近的均值（即聚类中心）所代表的聚类。该算法的目标是最小化所有样本到其聚类中心的距离平方和，这也被称为惯性（inertia）。在这篇文章中，我们深入探讨了K-means聚类算法，这是一种基于距离的简单而强大的无监督学习方法。K-means算法的核心目标是将数据集中的样本划分为K个簇，使得簇内的样本尽可能相似，而簇间的样本尽可能不同。

2024-11-20 14:41:36 782 1

原创机器学习算法之GMM聚类

高斯混合模型（GMM）是一种基于概率的聚类方法，假设数据集由多个高斯分布（也称为“成分”或“簇”）混合生成。与K-Means等传统聚类算法不同，GMM不仅考虑簇的中心，还考虑簇的形状和大小，通过估计每个数据点属于各个簇的概率，实现更为灵活和准确的聚类效果。复杂数据分布：适用于簇形状不规则、大小不一的数据集。软聚类：允许数据点属于多个簇，适用于模糊边界的聚类任务。概率解释：提供每个数据点的聚类概率，有助于后续的统计分析和决策。

2024-11-20 14:18:00 2617 1

原创快速学会一个算法：DBSCAN聚类

DBSCAN是一种基于密度的聚类算法，其核心思想是通过密度的概念来定义簇。与传统的K-Means等算法不同，DBSCAN不需要预先指定簇的数量，而是根据数据的局部密度来进行聚类。这使得DBSCAN能够自动识别任意形状的簇，并且能够有效处理噪声数据。：邻域半径，指定数据点周围的邻域范围。MinPts：指定一个簇内至少需要包含的点数。核心点（Core Point）：在该点的ε邻域内包含至少MinPts个点。边界点（Border Point）

2024-11-19 22:07:09 1528

原创快速学会一个算法：层次聚类

层次聚类（Hierarchical Clustering）是一种通过构建层次结构来组织数据的聚类方法。与其他聚类算法不同，层次聚类不需要预先指定簇的数量，而是通过构建一个树状结构（树状图，Dendrogram）来展示数据的分层关系。凝聚层次聚类（Agglomerative Hierarchical Clustering）：自底向上，先将每个数据点视为一个单独的簇，然后逐步合并最相似的簇，直到所有数据点合并为一个簇或达到预定的簇数量。

2024-11-19 22:03:56 966

原创强化学习之课程学习法

课程学习是一种有计划的学习方法，模拟人类学习的过程。它通过设置逐步增加难度的任务序列，让学习系统从简单的任务开始，逐渐过渡到复杂任务。这一方法可以显著提高训练效率，避免智能体一开始就面临过于复杂的任务，从而导致学习过程困难。逐步难度增加：从简单的任务开始，逐步增加任务的难度，直到智能体能够解决最复杂的任务。动态调整：根据智能体的学习进展，动态调整任务的难度，保证学习的过程始终处于一个适当的挑战性范围。

2024-11-08 16:31:03 2546 3