自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 国内用modelscop下载chatglm3大模型权重

汇聚各领域最先进的机器学习模型,提供模型探索体验、推理、训练、部署和应用的一站式服务。安装modelscope。在以下社区找到对应模型。

2024-03-06 10:28:37 451

原创 Langchain-chatchat(开源项目基于知识库的问答)

上面的命令是将6006端口映射成127.0.0.1:6006这样的本地demo,他@后面的ip需要换成你建的服务器的ip,-p后的端口号换成你自己服务器的端口。它有28层transform,每层transform里有32个头,embeding是4096维度进行编码。本文章基于Autodl服务器部署的开源项目(可以去租一个16G或24G的服务器)里面的ssh对于新手可能不太好理解他需要你在本地cmd里创建相对应的接口。这里是用chatglm2-6b的模型需要12.5G的显存。1.基于LLM的对话。

2023-09-14 20:41:43 905

原创 transformer的输入到输出(维度以及矩阵计算)

维度变化:q*k.T=(3,5)*(5,3)=(3,3)(/^dk和softmax矩阵维度不变)维度变化:q*k.T=(3,5)*(5,3)=(3,3)(/^dk和softmax矩阵维度不变)z=(3,5*4)=(3,20) 注意力机制到这里就结束了(z为提取的向量特征)之后乘v=(3,3)*(3,5)=(3,5)(由于为4头注意力机制所以5乘4)之后乘v=(3,3)*(3,5)=(3,5)(由于为4头注意力机制所以5乘4)y=(3,5)的一个矩阵(包含了位置向量和单词向量)

2023-07-05 20:31:15 4906 4

原创 run - py: error : unrecognized arguments:run.pyRun-py:错误:无法识别的参数:run.py

运行文件异常报错

2023-03-27 13:51:18 1435

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除