【实战】Chatglm微调指引和部署（MNN）

华农度假村村长

已于 2023-06-15 20:12:45 修改

阅读量797

点赞数

文章标签： mnn git 人工智能

于 2023-06-12 15:34:20 首次发布

本文链接：https://blog.csdn.net/weixin_50862344/article/details/131099293

版权

一. Chatglm

相对简单，而且微调之后性能比较奇怪，可以参考ChatGLM-6B 的部署与微调教程

1.1 MNN部署

https://github.com/wangzhaode/ChatGLM-MNN

1.1.1 Linux部署

git clone https://github.com/wangzhaode/ChatGLM-MNN.git

（1）编译MNN

cd MNN
mkdir build && cd build

#使用cuda
cmake -DCMAKE_BUILD_TYPE=Release -DMNN_CUDA=ON ..
make -j$(nproc)
cd ../..#退出

（2）文件拷贝

cp -r MNN/include/MNN include
cp MNN/build/libMNN.so libs/
cp MNN/build/express/*.so  libs/

（3）权重下载
挂vpn

cd resource/models
# 下载fp16权值模型, 几乎没有精度损失
./download_models.sh fp16
# 下载int8权值模型，极少精度损失，推荐使用
./download_models.sh int8
# 下载int4权值模型，有一定精度损失
./download_models.sh int4

（4）体验

mkdir build && cd build
cmake -D WITH_CUDA=on ..

# start build(support Linux/Mac)
make -j$(nproc)

./cli_demo # cli demo
./web_demo # web ui demo

大概长这样但是很快就汇报内存，也是目前他们正在解决的问题
在这里插入图片描述

1.2 InferLLM部署

https://github.com/MegEngine/InferLLM

关注博主即可阅读全文

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

华农度假村村长

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ChatGLM和LLaMA中文指令微调教程.zip

06-24

本资源是大模型的微调教程内含数据集和模型连接，可以作为入门教程

基于ChatGLM的微调实现

夏栀的博客

07-15

2014

下面描述具体的实现过程。

参与评论您还未登录，请先登录后发表或查看评论

ChatGLM3-6B模型部署微调实战

热门推荐

结构之法算法之道

03-31

6万+

随着『GPT4多模态/Microsoft 365 Copilot/Github Copilot X/ChatGPT插件』的推出，绝大部分公司的技术产品服务，以及绝大部分人的工作都将被革新一遍类似iPhone的诞生大家面向iOS编程有了App Store现在有了ChatGPT插件/GPT应用商店，以后很多公司很多人面向GPT编程(很快技术人员分两种，一种懂GPT，一种不懂GPT)然ChatGPT/GPT4基本不可能开源了，而通过上文《

ChatGLM-6B模型微调实战（以 ADGEN (广告生成) 数据集为例，序列长度达 2048）

消极的人永远是对的，积极的人选择勇往直前

05-03

7109

ChatGLM-6B模型微调实战（以 ADGEN (广告生成) 数据集为例）

算法部署-使用MNN在嵌入式设备+手机+x86平台部署轻量化车牌识别算法Light-LPR-附项目源码+流程教程-优质项目实战

06-05

算法部署_使用MNN在嵌入式设备+手机+x86平台部署轻量化车牌识别算法Light-LPR_附项目源码+流程教程_优质项目实战

算法部署-使用NCNN+MNN+TNN部署超轻量级中文OCR算法-支持竖排文字识别+模型仅4M-优质算法部署项目实战.zip

03-07

算法部署_使用NCNN+MNN+TNN部署超轻量级中文OCR算法_支持竖排文字识别+模型仅4M_优质算法部署项目实战

算法部署-使用OpenVINO+NCNN+MNN部署anchor-free目标检测算法nanodet-附项目流程教程-项目源码

04-27

本项目聚焦于使用OpenVINO、NCNN和MNN框架来部署一款名为nanodet的anchor-free目标检测算法。这里我们将深入探讨这些知识点，以便理解和实践该项目。 **OpenVINO（Open Visual Inference and Neural Network ...

算法部署-使用TensorRT部署SuperPoint-SuperGlue算法-优质算法部署项目实战.zip

03-06

在本项目中，我们将深入探讨如何使用TensorRT部署SuperPoint和SuperGlue算法，这是一个优质的算法部署实战案例。TensorRT是NVIDIA推出的一款高性能的深度学习推理（Inference）优化和运行时库，它能够为深度学习模型...

Android MNN部署模型，直线检测，语音转换测试

08-25

本篇将深入探讨如何在Android环境中使用MNN部署模型，特别是针对直线检测和语音转换的测试。一、MNN简介 MNN设计的目标是优化模型的运行速度和内存占用，它支持多种神经网络结构，如卷积神经网络（CNN）、循环神经...

【工程记录】ChatGLM3-6B微调实践（Windows）

LZXCyrus的博客

12-19

4247

仅作个人学习记录用。本文记录ChatGLM3-6B在Windows操作系统中的微调实践。

Coolpi CM5运行ChatGLM-MNN大语言模型

weixin_43094786的博客

04-24

292

本文基于cool-pi CM5 32G内存版本验证，系统为coolpi官方ubuntu20.04.

ChatGLM-6B微调，P-Tuning，LoRA，Full parameter

liguandong

06-06

689

2个position，一个表征句子，一个表征mask区域的顺序，前缀decoder先对mask掉的句子进行双向attention，从query角度看，x1可以看到x1到M，从mask decoder角度讲，x1作为query肯定看不到x1后面的，满阵表示可以看到整个序列，所以这部分是双向attention，后面的两者掩码是单向的decoder，是gpt。【官方教程】ChatGLM-6B 微调：P-Tuning，LoRA，Full parameter_哔哩哔哩_bilibili。

chatGLM3微调

huiguo_的博客

11-22

4795

大模型摘要微调

ChatGLM 微调实战

AI生成式技术曾小健

05-26

2695

通过排序序列前两篇文章主要对 RM 和 RL 两部分进行了讲解和实验，但无数的经验向我们证明 —— 拥有一个好的 SFT 的模型对后两步的训练至关重要。由于在 RL 训练过程中会加入与 SFT 模型的相似度（KL-Divergence）惩罚，这意味着 RL 模型的上限很大程度上取决于 SFT 模型。为此，我们今天来重点讲一讲如何通过 ChatGLM 来微调一个读懂我们指令的模型。

【Instruction Tuning】ChatGLM 微调实战（附源码）

人工智能曾小健

06-14

3183

Instruction Tuning 来微调一个监督学习模型排序序列来训练一个打分模型前两篇文章主要对 RM 和 RL 两部分进行了讲解和实验，但无数的经验向我们证明 —— 拥有一个好的 SFT 的模型对后两步的训练至关重要。由于在 RL 训练过程中会加入与 SFT 模型的相似度（KL-Divergence）惩罚，这意味着 RL 模型的上限很大程度上取决于 SFT 模型。为此，我们今天来重点讲一讲如何通过 ChatGLM 来微调一个读懂我们指令的模型。

大模型笔记之-ChatGLM2微调（基于Windows10 22H2+RTX2080ti 实现）

JunHowie的个人Blog

11-03

3353

本文仅仅简单介绍了如何在Windows环境下微调及使用ChatGLM2-6B

【大模型】微调ChatGlm3-6b

Dong_ZH的博客

02-26

2323

指令微调ChatGlm3-6b。微调教程在github地址中给出，微调环境是Qwen提供的docker镜像为环境。镜像获取方式：docker pull qwenllm/qwen:cu117。

mnn部署yolov5

09-02

要使用MNN部署YOLOv5，首先需要将YOLOv5模型转换为MNN格式。可以使用GitHub上的代码将YOLOv5模型转换为MNN模型。根据给定的命令，可以通过运行以下命令将YOLOv5s模型转换为MNN模型： ``` ./MNN-1.1.0/build/...