Xtuner微调小助手

最新推荐文章于 2024-08-09 22:24:25 发布

Orkeii

最新推荐文章于 2024-08-09 22:24:25 发布

阅读量184

点赞数 1

文章标签：人工智能

本文链接：https://blog.csdn.net/Orkeii/article/details/138453768

版权

本文探讨了微调在AI中的两种范式——增量预训练微调和指令跟随对话模板训练，重点介绍了Xtuner的数据处理关注内容质量。此外，还涵盖了全参数微调（包括LoRA和QLoRA优化）、4bit量化以及文本与图像多模态模型LLaVA的实践案例。

摘要由CSDN通过智能技术生成

参考：Tutorial/xtuner/personal_assistant_document.md at camp2 · InternLM/Tutorial (github.com)

微调两种范式：

增量预训练微调
- 使用场景：让底座模型学习新知识，例如某个垂直领域的常识
- 训练数据：文章、书籍、代码等
指令跟随微调
- 使用场景：让模型学会对话模板，根据人类指令进行对话
- 训练数据：高质量对话、问答数据

Xtuner数据处理：专注于数据的内容质量

微调方案

全参数微调加载模型和参数优化器
LoRA 加载模型和adapter的优化器
QLoRA 加载4bit量化后的模型和adapter的优化器

文本+图像多模态模型：LLaVA（识图而非生图）

作业实现：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Orkeii

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Xtuner微调小助手

第4节Xtunter微调
复制链接

扫一扫

实战Transformers模型微调

07-22

### 实战Transformers模型微调 #### 数据集处理库 Hugging Face Datasets **Hugging Face Datasets 库简介** Hugging Face Datasets 库是一个非常实用的工具，它为开发者提供了轻松访问和共享音频、计算机视觉...

微调数字

10-31

### 微调数字知识点解析 #### 一、概念理解 **微调数字**通常指的是在软件开发或用户界面设计中，允许用户对数值进行精细调整的功能。这种功能常见于各种编辑器、设置面板或者需要精确数值输入的应用场景中。通过...

参与评论您还未登录，请先登录后发表或查看评论

MOSS微调数据转换脚本

06-06

在IT行业中，模型优化与微调是机器学习和自然语言处理领域的重要环节。"MOSS微调数据转换脚本"的目的是将特定的数据格式转换为适用于MOSS（可能是多模态预训练模型）进行微调的格式。在这个场景中，我们处理的是来自...

大模型微调学习路径.pptx

05-31

大模型微调学习路径.pptx

大模型微调工具-torchtune

weixin_40777649的博客

08-08

492

1.定义2.安装3. 案例。

根据哈希值或者特征值判断图片是否相同

最新发布

Y_warmth

08-09

211

detectAndCompute 方法结合了特征检测和描述符计算两个步骤，可以在图像中检测出特征点并计算这些特征点的描述符。ORB（Oriented FAST and Rotated BRIEF）是一种结合了 FAST 特征检测器和 BRIEF 描述符的特征提取算法，具有旋转不变性和尺度不变性，适用于图像特征匹配、目标检测等任务。接着使用 ORB 对象的 detectAndCompute() 方法检测图像中的特征点并计算描述符，最后将特征点绘制在图像上并显示出来。

Crowd-SAM：SAM作为拥挤场景中目标检测的智能标注器

AI浩

08-06

896

问题定义。如图1所示，我们的目标是在标记数据很少的情况下，检测拥挤场景中的对象（如行人）。我们将此问题表述为一类小样本检测任务。常见的小样本流程是将数据分为基础集和新集。不同的是，我们直接使用目标类的数据进行模型训练，因为基础模型已经在大规模数据上进行了训练。特别是，我们采用分割掩码作为中间结果，这些结果可以很容易地转换为边界框。在训练和评估过程中，仅提供边界框标注。对SAM自动生成器的初步研究。提示数量会影响SAM的性能，我们针对拥挤场景分析了这一问题。

电脑技巧：9个免费的AI图片无损放大工具和网站

08-05

921

今天小编给大家介绍9款免费的AI图片放大工具和网站，帮助你提高图片清晰度，感兴趣的朋友可以自己试一试！美图设计室是美图秀秀公司推出的一款在线图片编辑和设计工具箱，提供包括AI 抠图、AI海报、AI PPT、AI消除、AI文生图、AI变清晰、AI无损放大等AI图片编辑工具。其提供的图片无损放大功能，目前是限时免费中，可以帮助用户将JPG、JPEG、PNG、HEIC等格式的图片放大清晰不失真，细节更丰富。✅ 产品优点由美图推出，产品功能稳定，处理速度较快支持免费进行图片放大到8倍。

pytorch下载慢，如何下载到本地再去安装，本地安装pytorch

weixin_53035684的博客

08-09

181

本地安装torch

RPA+AI有什么应用？6大技术融合方向分析 | 实在RPA研究

SHIZAIZHINENG的博客

08-06

1038

随着数字化转型的加速，企业正寻求更高效、智能的方法来优化业务流程。机器人流程自动化（RPA）作为一种快速兴起的技术，已经证明了其在自动化重复性任务方面的能力。然而，当RPA与各种人工智能（AI）技术相结合时，其潜力将得到更全面的释放。本文将探讨不同的AI技术如何与RPA结合，以及这种结合为企业带来的变革性应用方向。机器学习 (ML)使系统能够从数据中学习和改进提高预测准确性，自动化决策制定风险管理、欺诈检测、个性化推荐银行使用ML增强RPA进行信用评分和欺诈识别计算机视觉 (CV)

线性代数课程概要介绍

08-07

863

线性代数课程内容丰富，主要围绕向量、矩阵和线性变换等核心概念展开，旨在培养学生的空间直观和想象能力、抽象思维和逻辑推理能力。线性代数是理工科大学生必修的数学基础课之一，也是硕士研究生入学全国统一考试中必考的数学课程之一。它不仅是离散化和数值计算的理论基础，还广泛应用于自然科学、社会科学、工程技术、军事和工农业生产等领域。

打造智能障碍物检测系统：从零开始的深度学习项目

a871923942的博客

08-05

1064

随着自动驾驶技术的发展，障碍物检测成为保障行车安全的重要一环。通过深度学习模型，尤其是YOLO（You Only Look Once）模型，可以高效、准确地检测道路上的障碍物，从而提高自动驾驶系统的安全性和可靠性。

python识别车辆标志

weixin_45570158的博客

08-09

292

要使用Python来识别车辆标志，你通常会用到计算机视觉库，如OpenCV，结合深度学习框架如TensorFlow或PyTorch。这里我将提供一个基于OpenCV和TensorFlow（使用预训练模型，如MobileNetV2）的基本示例。

【知识】PyTorch中的数据类型dtype

xfxuezhang.cn

08-09

843

对数据类型有个大致的了解还是很必要的

如何释放生成式AI潜力？物联网技术是关键

趣味科技v

08-08

469

在生成式AI热潮席卷全球的今天，物联网（Internet of Things，简称IoT）技术正在成为充分释放生成式AI潜力的关键。近日，在亚马逊云科技汽车暨制造与消费电子行业峰会上，亚马逊云科技全球副总裁、物联网技术负责人Yasser Alsaied指出，生成式AI需要持续不断产生的高质量数据作为基础，而物联网相当于“数据收集器”，可以通过传感器或智能摄像头等采集的精准数据，为大模型后续的推理与...

【编译原理文法概述】

武帝为此的博客

08-05

705

文法（Grammar）是描述语言语法结构的一种形式化系统，用于定义合法字符串的集合。在编译原理中，文法是用于定义编程语言语法的一套规则。通过这些规则，我们可以确定某个字符串是否属于该语言，及其结构如何。这些规则定义了如何从起始符号生成语言中的字符串，进而描述了语言的语法。

sheng的学习笔记-AI-k近邻学习（kNN)

coldstarry的专栏

08-07

411

k近邻（k-Nearest Neighbor，简称kNN）学习是一种常用的监督学习方法，是一种基本的分类与回归方法。分类问题：对新的样本，根据其 k 个最近邻的训练样本的类别，通过多数表决等方式进行预测。回归问题：对新的样本，根据其 k 个最近邻的训练样本标签值的均值作为预测值。

开源力量：PlugLink如何重塑中文AI技术生态系统（附源码）

AI心易行者

08-08

1026

随着中文互联网生态的蓬勃发展，AI技术的应用正以前所未有的速度改变着我们的工作与生活。在这股洪流之中，——一个专注于链接AI技术与实际业务场景的开源应用，正在悄然引领一场技术与运营的融合革命。本文将深入剖析PlugLink如何巧妙地将AI技术融入日常工作流程，提高效率，降低成本，同时，我们也将一窥其内部机制，并探索如何利用它来解决中文环境下的特定挑战。

昇思基础课程打卡（SPONGE课前学习）9.使用静态图加速

cftang9999的专栏

08-06

682

AI编译框架分为两种运行模式，分别是动态图模式以及静态图模式。MindSpore默认情况下是以动态图模式运行，但也支持手工切换为静态图模式。

XTuner大模型微调

06-28

XTuner是一个专为深度学习模型微调设计的工具或框架，它可能用于优化模型性能，特别是针对特定任务或数据集进行个性化调整。微调（Fine-tuning）是指在一个预训练模型的基础上，使用新的、特定领域的数据对其进行训练，以适应新任务或改进其在特定环境下的性能。具体来说，XTuner可能包含以下特点和步骤： 1. **预训练模型导入**：从大规模的通用模型（如BERT、ResNet等）加载预训练权重。 2. **数据准备**：对微调任务的数据进行清洗、标注和格式转换，使其与预训练模型的要求一致。 3. **模型微调**：选择合适的层进行训练，通常保留低级别的特征提取器，只更新或添加新添加的层，以减少过拟合。 4. **超参数调优**：使用XTuner进行超参数搜索，找到最优配置以提高模型性能。 5. **评估与验证**：在验证集上监控模型性能，调整微调策略。 6. **部署与应用**：将微调后的模型应用于实际场景中，如自然语言处理任务、计算机视觉任务等。