自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 【Llama3源码】llama3-implemented-from-scratch源码运行踩坑Incorrect padding

Error: Incorrect padding

2024-06-18 22:07:42 345 3

原创 【Llama源码】激活函数--SiLU (Sigmoid Linear Unit)

【代码】【Llama源码】激活函数--SiLU (Sigmoid Linear Unit)

2024-05-29 23:39:08 264

原创 【Llama源码】图解llama架构

分享B站UP主图解llama架构,强裂推荐,架构图配合源码,更清晰。

2024-05-29 22:59:57 162

原创 【Llama源码】旋转位置编码ROPE--源码阅读

inv_freq为size=torch.Size([dim//2])的tensor。前向调用,负责生成旋转矩阵中的。q、cos、sin对应下标顺序与。

2024-05-29 22:16:32 1065

原创 【Pytorch】torch.gather

定义:从原tensor中获取指定dim和指定index的数据,生成新的tensor。

2024-05-29 15:28:21 978

原创 【Llama源码】归一化RMSNorm

RMSNorm是在Layer Norm之上的改进,它通过舍弃中心不变性来降低计算量。针对输入input的每个元素的平方根的倒数来返回一个新的Tensor。

2024-05-29 11:32:32 697

原创 【Pytorch】torch.einsum

实现outer product功能。

2024-05-29 10:30:17 309

原创 【Transformers源码】分词器的一点尝试

分词器的add_tokens和add_special_tokens一点点尝试

2024-05-26 01:08:51 166

原创 【Transformers源码】degbug model tips

debug源码可以更快速高效的学习model,是不是要等模型文件下载完,才能debug,等待下载LLM的模型文件是不是内心有那么亿丢丢的焦灼…

2024-05-26 00:49:46 342

原创 【大模型学习】应用方案,更新ing

大模型应用方案收集。Agent,Rag

2024-05-17 10:02:58 200

原创 RuntimeError: “bernoulli_scalar_cpu_“ not implemented for ‘Half‘

P-tuning在M2芯片macbook运行报错。

2024-05-17 09:40:38 122

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除