自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 baichuan 13b 代码解析

记录baichuan 13b chat 中代码的一些个人理解。

2023-12-28 16:39:20 920

原创 【预训练语言模型中的一些位置编码】

定义Ww1​...wN​表示一个长度为N的文本,wi​表示文本中第i个token;X表示w对应的embedding,Xx1​...xN​xi​表示文本中第i个token对应的embedding,特征维度为d。利用词嵌入和位置信息计算自注意力中的qkvqm​fq​xm​m1kn​fk​xn​n2vn​fv​xn​n3公式(1)中的qm​表示第m个token对应的词向量x。

2023-11-02 11:45:16 143 1

原创 【LLM高效参数微调】

苏剑林. (Apr. 03, 2021). 《P-tuning:自动构建模版,释放语言模型潜能 》[Blog post]. Retrieved from https://spaces.ac.cn/archives/8295。LLM高效参数微调方法:从Prefix Tuning、Prompt Tuning、P-TuningV1/V2到LoRA、QLoRA(含对模型量化的解释)本文只是记录了自己的一些理解。

2023-10-30 16:48:46 73 1

原创 Chatglm-130b本地部署教程

记录chatglm-130b的部署过程本地服务器环境:A40 (48G) *4 Ubuntu 20.04.3 LTS。

2023-09-19 17:22:27 2768 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除