昇思25天学习打卡营第13天 | MindNLP ChatGLM-6B StreamChat

cftang9999

已于 2024-07-01 10:08:29 修改

阅读量247

点赞数 2

文章标签：学习

于 2024-07-01 09:22:07 首次发布

本文链接：https://blog.csdn.net/cftang9999/article/details/140092092

版权

MindNLP ChatGLM-6B StreamChat

本案例基于MindNLP和ChatGLM-6B实现一个聊天应用。

1 环境配置

%%capture captured_output
# 实验环境已经预装了mindspore==2.2.14，如需更换mindspore版本，可更改下面mindspore的版本号
!pip uninstall mindspore -y
!pip install -i https://pypi.mirrors.ustc.edu.cn/simple mindspore==2.2.14
!pip install mindnlp mdtex2html

配置网络线路

!export HF_ENDPOINT=https://hf-mirror.com

2 代码开发

下载权重大约需要10分钟

from mindnlp.transformers import AutoModelForSeq2SeqLM, AutoTokenizer
import gradio as gr
import mdtex2html

model = AutoModelForSeq2SeqLM.from_pretrained('ZhipuAI/ChatGLM-6B', mirror="modelscope").half()
model.set_train(False)
tokenizer = AutoTokenizer.from_pretrained('ZhipuAI/ChatGLM-6B', mirror="modelscope")

Building prefix dict from the default dictionary ...
Loading model from cache /tmp/jieba.cache
Loading model cost 1.029 seconds.
Prefix dict has been built successfully.



Loading checkpoint shards:   0%|          | 0/8 [00:00<?, ?it/s]



  0%|          | 0.00/441 [00:00<?, ?B/s]



  0%|          | 0.00/2.58M [00:00<?, ?B/s]

可以修改下列参数和prompt体验模型

prompt = '你好'
history = []
response, _ = model.chat(tokenizer, prompt, history=history, max_length=20)
response

-

The dtype of attention mask (Float32) is not bool


|




'你好👋！我是人工智能助手 ChatGLM-6B'

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

cftang9999

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

昇思25天学习打卡营第12天|文本解码原理--以MindNLP为例

数字人生

06-30

865

Beam search通过在每个时间步保留最可能的 num_beams 个词，并从中最终选择出概率最高的序列来降低丢失潜在的高概率序列的风险。Top-K Sampling和Top-P Sampling：进一步优化采样过程，分别限制采样空间至最高概率的K个词或累计概率达到P的词集合，平衡生成的可控性和创新性。示例：以生成序列"The nice woman"为例，虽然每个步骤都选择了局部最优，但可能错过了整体概率更高的序列("The","dog","has")。增加高概率单词的似然并降低低概率单词的似然。

昇思25天学习打卡营第11天|MindSpore-基于MindNLP+MusicGen生成自己的个性化音乐

pblh123的专栏

07-04

1398

MusicGen是来自Meta AI的Jade Copet等人提出的基于单个语言模型（LM）的音乐生成模型，支持无提示、文本、音频生成音乐。

参与评论您还未登录，请先登录后发表或查看评论

【云驻共创】华为云之昇思MindSpore大模型专题（第二期）-第一课：ChatGLM

热门推荐

时光隧道

01-11

6万+

昇思MindSpore是华为公司推出的一款全场景AI计算框架。它提供了自动微分、分布式训练和推理、模型部署等功能，支持多种硬件平台，包括CPU、GPU和Ascend AI 处理器。MindSpore采用图和算子相结合的编程模型，能够高效地处理复杂的深度学习任务。它具有灵活的设计、高效的性能和易于使用的接口，使开发者能够更快地开发和部署AI应用。MindSpore还支持自定义操作和算法，可以满足不同场景下的需求。完整的课程学习地址。

mindspore ChatGLM-6B

m0_73546954的博客

07-01

321

主要考虑下载的速度，存储空间是否足够，显存大小。当然如果是使用大语言模型的话，最方便的还是使用在线的大语言模型，比如chatgpt4，通义千问，文心一言，kimi，豆包这些吧。这里直接从modelscope下载ChatGLM-6B模型，采用half的半精度，这种简版的模型权重更小，需要的运行占用内存更少，适合推理。这样运行代码后，会从镜像下载模型。首先安装mindspore，mindnlp，mdtex2html，gradio库。一些大语言模型可以下载对应的模型参数后，进行推理和微调。

昇思25天学习打卡营第18天|MindNLP ChatGLM-6B StreamChat

pblh123的专栏

07-11

972

MindNLP ChatGLM-6B StreamChat是基于MindNLP框架和ChatGLM-6B模型实现的聊天应用，利用自然语言处理技术，实现与用户的自然语言交流。这样的应用可以广泛应用于智能客服、在线助理和社交聊天等场景

昇思25天学习打卡营第16天|LLM-MindNLP ChatGLM-6B StreamChat

wwt72的博客

07-21

1167

但是可以看到model的打印结果，看到chatglm2 和 chatglm3 的模型结构相比1版本，词表扩充了2w+。：dim[in, out]=[130528, 4096] ，即使用了 130528 个词汇，每个词汇映射到一个4096维的向量。，多层感知机，用于对自注意力层的输出进行进一步的非线性变换。如下图，chatglm2-6b model 的打印结果。加载智谱清言的chatglm模型权重文件（目前有4个版本），本次主要尝试了chatglm-6b。，是transformer 结构，是模型的核心部分。

昇思25天学习打卡营第12天 | LLM原理和实践：MindNLP ChatGLM-6B StreamChat

loveisastory的博客

07-06

642

本文主要介绍了使用mindnlp下载chatglm-6B预训练模型，并基于此模型，通过输入提示词完成回答文本生成的模型推理任务，从而实现了一个简单的聊天应用。

《昇思25天学习打卡营第1天 - 快速入门 mindspore》

06-27

昇思25天学习打卡营 - 02 快速入门

昇思25天学习打卡营第14天|基于MindNLP的文本解码原理

pblh123的专栏

07-07

1654

基于MindSpore,MindNPL实现自回归模型，贪婪搜索，Bean搜索，文本解码是自然语言处理中的一个关键任务，特别是在机器翻译、文本生成等领域。自回归模型是文本解码中常用的一种方法

昇思25天学习打卡营第19天|MindNLP ChatGLM-6B StreamChat

Wayne的CSDN博客

07-20

462

MindNLP-ChatGLM演示

昇思25天学习打卡营第25天|MindNLP ChatGLM-6B StreamChat

m0_62894627的博客

07-13

638

基于MindNLP和ChatGLM-6B实现一个聊天应用。

Greiner 经典力学（多体系统和哈密顿力学）第十二章学习笔记（Rotation About a Point）

Ivan 的专栏

11-09

1156

上一章是绕定轴转动，这章是绕定点转动。这一章明显上难度了。

一、HTML学习（基础知识学习）

weixin_44463519的博客

11-11

998

前端学习第一章之HTML学习

Vue3学习：查询城市天气预报案例（vite，选项式）

wangyining070205的博客

11-13

556

前几日的学习中，实现了查询城市天气预报，是用组合式实现的，今天是用选项式来实现，案例运行效果如下：如果不输入城市的名字，直接点击“查询”，将会显示IP所在地城市的天气预报。代码如下： <template> <div id="container"> <div id="search"> <el-input v-model="cityName" placeholder="请输入城市名" class="inputText

ue5 蓝图学习（一）结构体的使用

最新发布

cat_want_fly的博客

11-13

200

在变量的右侧，变量类型里搜索strcut，可以查找到刚才定义的结构体。可以通过 break +结构体名字来拆分结构体，单独使用属性。下面这东西就是结构体，和C++的结构体差不多。可以添加变量，设置变量的类型和默认值。在内容浏览器中右键蓝图-选择结构体。点击打开关卡蓝图，添加变量。选择中断 MYstruct。可以在关卡蓝图中调用它。拉出来之后，可以使用。

Java基于小程序公考学习平台的设计与实现（附源码，文档）

chusheng1840的博客

11-09

1320

Java基于小程序公考学习平台的设计与实现，小程序公考学习平台使用Java语言进行编码，使用Mysql创建数据表保存本系统产生的数据。系统可以提供信息显示和相应服务，其管理小程序公考学习平台信息，查看小程序公考学习平台信息，管理小程序公考学习平台。总之，小程序公考学习平台集中管理信息，有着保密性强，效率高，存储空间大，成本低等诸多优点。它可以降低信息管理成本，实现信息管理计算机化。关键词：小程序公考学习平台；Java语言；Mysql。

Unity类银河战士恶魔城学习总结（P120 BUff Item Effect各种增益效果）

suzh1qian的博客

11-11

701

演示：给冰与火之歌加上了持续火焰伤害的buff，这样武器后续攻击到的敌人就会收到火焰伤害。

RHCE的学习（11）

Starry__Sky222的博客

11-08

802

什么是防火墙分类：Netfilter(数据包过滤)分析内容：防火墙无法完成的任务iptables 与 firewalld 区别iptables执行原则防火墙规则规则链的匹配顺序iptables 流量处理动作四种规则表预处理管理命令规则链存储文件iptables 命令参数firewalld特点区域 zonezone文件中的过滤规则可视化界面工具firewall-cmd命令行工具firewalld命令生效模式管理命令设置命令：firewall-cmd 参数

CSS学习

雷神乐乐的博客

11-10

998

CSS学习

2024-11-10-C++ 学习：变量和基本类型课后习题（ Primer 第二章）（选做）

weixin_42269028的博客

11-10

906

多做题，多思考，多记多背，加油~