自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 大模型学习笔记——模型架构

7.1 模型概括分词架构:Transformer7.2 分词句子转化成单词序列。7.2.1 基于空格分词字节编码(BPE)BPE 算法的基本步骤:1. 初始化词汇表:将输入文本中的每个字符或字符组合作为初始的词汇表。2. 计算字符(或字符组合)的频率:统计文本中每个字符(或字符组合)的频率,并构建一个频率字典。3. 合并最频繁的字符(或字符组合):选择频率最高的字符(或字符组合)并将其合并为一个新的字符或字符组合。更新词汇表和频率字典。

2023-12-17 23:59:28 960 1

原创 大模型学习笔记二——大模型的能力

任务在这被定义为从输入到输出。(这个适应可以理解为,原来就是模型只是单纯的理解这句话,适应之后能够回答这句话)。这个过程要两个输入:1、任务的自然语言描述;2、训练(一是有监督的学习另一个是通过上下文学习。关于GPT-3的任务的讨论点和结果之类的。

2023-12-13 20:45:47 439 1

原创 大模型学习学习笔记(第一天)

LLM大模型学习引言,

2023-12-11 20:53:24 997

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除