【项目实训】基于大模型的小学语数英辅助教育平台 | 使用阿里云平台对Qwen模型进行微调

最新推荐文章于 2024-07-25 17:43:37 发布

希望有书读的小菜同学

最新推荐文章于 2024-07-25 17:43:37 发布

阅读量168

点赞数 7

文章标签：阿里云云计算

本文链接：https://blog.csdn.net/weixin_64316624/article/details/139910900

版权

本节主要是熟悉阿里云PAI平台，导入模型并使用LoRa和前期处理好的数据进行微调

一、阿里云PAI平台

使用PAI平台中的交互式建模平台DSW进行训练。

首先创建工作空间，对其名称、可见性、存储空间等进行设置

然后创建DSW实例，对实例名称、计算资源、镜像环境等进行设置，需要注意镜像环境是否满足要求的训练环境

二、将模型加载到DSW中

我们这里选择从魔搭社区下载模型并加载到DSW中，以Qwen-7B-Chat-Int4为例

from modelscope import AutoModelForCausalLM, AutoTokenizer
from modelscope import GenerationConfig

from modelscope import snapshot_download
model_dir = snapshot_download('qwen/Qwen-7B-Chat-Int4',cache_dir='model')

三、使用peft进行LoRa微调模型

传入预训练模型路径、数据路径、训练函数等进行训练，这里我们使用Qwen-7B-Chat-Int4模型，qlora训练方法和自己前期处理好的数据集进行训练

训练好的权重文件如下：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

希望有书读的小菜同学

关注关注

7
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【项目实训】基于大模型的小学语数英辅助教育平台 | 使用阿里云平台对Qwen模型进行微调

本节主要是熟悉阿里云PAI平台，导入模型并使用LoRa和前期处理好的数据进行微调。
复制链接

扫一扫

多模态大模型微调-基于Lora对Qwen-VL多模态大模型进行微调-附项目源码+流程教程-优质项目实战.zip

05-16

多模态大模型微调_基于Lora对Qwen_VL多模态大模型进行微调_附项目源码+流程教程_优质项目实战

Unsloth框架在Windows平台微调训练Qwen2大模型，非WSL.zip

07-26

个人深耕AI大模型应用领域积累的成果，希望对您有所帮助。有大模型账号、环境问题、AI大模型技术应用落地方案等相关问题，欢迎详聊，能为您解决问题是我的荣幸！个人深耕AI大模型应用领域积累的成果，希望对您有所...

参与评论您还未登录，请先登录后发表或查看评论

创新项目实训--基于大模型的小学语数英辅助教育平台（2）

weixin_61665230的博客

04-25

614

项目采用Qwen1.5-7B-chat，LoRa训练要求20G显存左右，故试采用阿里云PAI平台DSW服务，配合魔搭生态便于微调。

【项目实训】基于大模型的小学语数英辅助教育平台 | 相关技术调研

weixin_64316624的博客

05-31

435

在实现该平台的过程中，我们需要考虑以下几个方面的实现1.训练资源2.选用哪个大模型3.如何将大模型应用于我们的垂直领域4.怎么训练5.训练数据接下来将针对以上内容进行调研和整理。

【项目实训】基于大模型的小学语数英辅助教育平台 | 多模型多参数训练

weixin_64316624的博客

06-24

148

在使用阿里云平台对Qwen-7B-Chat-Int4训练完成后，我们进一步训练了Qwen_1.5、Qwen_7B、Qwen_7B_chat等不同模型进行训练，同时设置不同的epoch等参数，对比寻找在我们当前资源条件下最优的微调结果。最后选用了Qwen-7B-Chat-Int4的微调结果。

整理了上百个开源中文大语言模型，涵盖模型、应用、数据集、微调、部署、评测_基于大语言模型的网络自动配置平台的设计与开发

2401_84208172的博客

07-24

787

自ChatGPT为代表的大语言模型（Large Language Model, LLM）出现以后，由于其惊人的类通用人工智能（AGI）的能力，掀起了新一轮自然语言处理领域的研究和应用的浪潮。尤其是以ChatGLM、LLaMA等平民玩家都能跑起来的较小规模的LLM开源之后，业界涌现了非常多基于LLM的二次微调或应用的案例。本项目旨在收集和梳理中文LLM相关的开源模型、应用、数据集及教程等资料，目前收录的资源已达100+个！

在window平台大模型LoRA微调实战（完整代码带数据）

qyhua的专栏

07-24

908

本次微调最开始是打算使用Qwen/Qwen-1_8B-Chat的模型作为微调对象，调试过程中不断报GPU显存不够，该模型需要的显存超过12G，因此后面改用 Qwen/Qwen1.5-0.5B-Chat 模型。这里的注意力投影与多层感知的层作是："c_attn", "c_proj", "w1", "w2"从上面对比图可以看出，微调后的回答的答案与模型合并的模型都差不多效果，比较准确。微调前回复答案明显多了一些不像关键字的没有微调后的好，说明确实有效果。方法保存微调后的模型到指定目录。我们调整大模型哪些层，

大模型 | 此“模型”非彼“模型”：5分钟实现一个数字化审计分析助手

python122_的博客

05-02

985

一方面，作为实习生，它的可塑性很强，只要你愿意花时间引导它，它能学会你希望它学会的东西，从而帮你完成你指定的工作。该阶段让大家对大模型 AI有一个最前沿的认识，对大模型 AI 的理解超过 95% 的人，可以在相关讨论时发表高级、不跟风、又接地气的见解，别人只会和 AI 聊天，而你能调教 AI，并能用代码将大模型和业务衔接。个人感觉，大模型时代的“模型”和我们过去在学习、工作、生活中形成的模型认识，无论是内涵和外延都发生了翻天覆地的变化，用“世界模型”的视角来理解大模型之“模型”更合适。

生成式AI第五章大语言模型微调

2401_84204207的博客

06-14

662

下面深入探讨第四种方法：适配器。到目前为止，我们已经探讨了用于文本分类的DistilBERT微调和生成特定风格文本的GPT-2。这两者在微调过程中修改了模型的所有权重。微调比预训练更有效，因为我们不需要太多的数据或计算能力。然而，随着更大模型的趋势不断增长，在消费者硬件上进行传统微调变得不可行。此外，如果我们想为不同任务微调一个编码器模型，最终会有多个模型。欢迎使用PEFT！参数高效微调（PEFT）是一组技术，使得在不微调所有模型参数的情况下调整预训练模型成为可能。

国内 AI大模型产业发展深度分析 2024

2401_85280228的博客

07-04

1632

文心一言是百度研发的人工智能大语言模型产品，具备跨模态、跨语言的深度语义理解与生成能力，在文学创作、文案创作、搜索问答、多模态生成、数理逻辑推算等众多领域都能为用户提供高质量服务。文心一言拥有四大基础能力：理解能力、生成能力、逻辑能力、记忆能力。（2）大模型优势：2023 年 10 月发布的“文心大模型 4.0”，相比上一代文心大模型，四大能力显著升级，其中逻辑提升幅度是理解的 3 倍，记忆提升幅度是理解的 2 倍。

大模型应用-基于Qwen2模型进行通用结构化信息提取-附项目源码+流程教程-优质项目实战.zip

最新发布

07-26

大模型应用_基于Qwen2模型进行通用结构化信息提取_附项目源码+流程教程_优质项目实战

大语言模型部署-使用OpenVINO部署通义千问QWen2-附项目源码+流程教程-优质项目实战.zip

06-07

QWen2是阿里云推出的大规模预训练语言模型，具有强大的自然语言理解和生成能力，能够处理各种复杂的对话、问答和文本生成任务。将这样一个复杂模型部署到实际应用中，需要解决计算资源、性能优化和效率等问题。 ...

大模型部署-基于TensorRT-LLM部署Qwen1.5大语言模型-附项目源码+流程教程-优质项目实战.zip

07-26

大模型部署_基于TensorRT-LLM部署Qwen1.5大语言模型_附项目源码+流程教程_优质项目实战

通过IEC104转MQTT网关轻松接入阿里云平台

钡铼技术工业物联网

07-25

488

MQTT Client支持每个发布主题选择不同的数据点发布，鼠标光标放在右边方框内，点击鼠标右键，弹出提示框，点击“添加”，弹出数据点框，点击要发布的数据点，点击“确定”。IEC104转阿里云网关能够将IEC104协议的数据转换为MQTT消息，并通过阿里云物联网平台发布，任何支持MQTT协议的设备或应用都可以订阅这些消息，实现数据的实时共享与处理。可以将IEC 104设备的电力数据传输至Zabbix平台进行进一步的分析与处理，这种跨平台的数据集成能力为电力系统的智能化、精细化管理提供了更多可能性。

IEC104转MQTT网关轻松将IEC104设备数据传输到Zabbix、阿里云、华为云、亚马逊AWS、ThingsBoard、Ignition云平台

钡铼技术工业物联网

07-25

621

IEC104转MQTT网关BE113作为这一融合过程中的关键设备，其能够将IEC 104协议的数据转换为MQTT消息，从而轻松接入Zabbix、阿里云、华为云、亚马逊AWS、ThingsBoard、Ignition等平台，实现数据的实时传输、监控与分析。是一款功能强大的工业自动化平台，它提供了丰富的可视化工具、实时数据监控与处理能力。钡铼网关BE113在Zabbix、阿里云、华为云、亚马逊AWS、ThingsBoard、Ignition等多元化平台中的应用，为电力系统的智能化管理和监控提供了有力支持。

Elastic 及阿里云 AI 搜索 Tech Day 将于 7 月 27 日在上海举办

Elastic 中国社区官方博客

07-22

1196

参加 Elastic 原厂与阿里云联合举办的 Generative AI 技术交流分享日。借助 The Elastic Search AI Platform，使用开放且灵活的企业解决方案，以前所未有的速度获得搜索最相关的结果。借助强大搜索功能和生成式 AI 的合力，加速商业转化和业务成果。

虚拟机已经连上网可是yum用不了，可以将 CentOS 的 yum 源镜像修改为阿里云的镜像源（http://mirrors.aliyun.com/）

qq_62752002的博客

07-22

213

你可以通过以下步骤将 CentOS 的yum源镜像修改为阿里云的镜像源。

56、本地数据库迁移到阿里云

m0_74149099的博客

07-20

443

1、登录阿里云界面创建免费试用ECS实列。2、选择2核4G，centos7.6，两台机器，然后设置账户密码，以及查看公网ip。3、xshell客户端新建连接，ip地址为ECS实例的公网地址。4、5、通过scp用mysql进行传输数据压缩包6、创建数据库xy102，以及test1、test2表7、备份数据库xy102.sql到/opt目录下8、阿里云主机安装mysql数据库9、传送xy102数据库到阿里云主机上10、热备份恢复数据库到阿里云主机上。

Qwen20.5b大模型微调

06-28

Qwen20.5b是一个预训练语言模型，它是阿里云自主研发的大规模语言模型。微调（Fine-tuning）是将大型预训练模型应用于特定任务的过程，通过调整模型的部分参数或全部参数，使其适应新的数据集和上下文。对Qwen20.5...