LLM:学习清单 ing

灵海之森

已于 2024-07-13 11:08:04 修改

阅读量205

点赞数 6

分类专栏： LLM MM-LLM 文章标签：学习

于 2024-07-13 00:24:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43814415/article/details/140391081

版权

LLM 同时被 2 个专栏收录

34 篇文章 1 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

根据模型的数据流程方向和自己的经验列出：

一、模型输入

分词器：BPE，BBPE
位置编码：绝对位置编码，三角函数编码，ROPE
词向量模型：词袋，监督学习模型；BGE，BCE，BERT
transformers：手写数据集构造类、数据集加载函数colloctor

二、模型结构

transformers：结构，解码器only为啥比编码器好，llama在原始解码器上的改进及原因
归一化：层归一化，RNSnorm，批归一化，Pre-LN和Post-LN的区别
激活函数：tanh，relu，gelu，silu
FFN结构
注意力机制：自注意力，多头注意力，分组查询注意力，多查询注意力（前两个要手写）
softmax和sigmoid函数
llama结构，GLM结构

三、模型推理

推理原理
解码策略：温度等参数，需要结合代码理解
KVcache
长度外推：滑动窗口，rope，位置插值,yarn的原理
推理部署框架：vllm，fastapi
多轮对话实现原理
流式输出实现原理

四、模型训练

分布式：数据并行，模型并行，流水线并行
deepseed经验
多机多卡经验
参数调优经验
数据配比经验
高效微调：lora原理，peft使用
混合精度
模型量化
ppo,KTO ,dpo原理
损失函数：交叉熵的手动实现，熵的定义，最大似然函数，MSE

五、数据工程

预训练、sft、dpo数据集格式
主流数据集

六、多模态大模型

模型架构：BILP2、LLAVA1.5，书生2
模态数据处理：多图，多视频，图文交错
模型两阶段训练经验
数据集构造经验

六、产品应用

RAG：作用，流程，性能调优经验
agent：作用，实现方法，优化经验

关注

6
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
LLM:学习清单 ing

归一化：层归一化，RNSnorm，批归一化，Pre-LN和Post-LN的区别。注意力机制：自注意力，多头注意力，分组查询注意力，多查询注意力（前两个要手写）BGE，BCE，BERT。长度外推：滑动窗口，rope，位置插值,yarn的原理。激活函数：tanh，relu，gelu，silu。位置编码：绝对位置编码，三角函数编码，ROPE。分布式：数据并行，模型并行，流水线并行。模态数据处理：多图，多视频，图文交错。agent：作用，实现方法，优化经验。RAG：作用，流程，性能调优经验。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

灵海之森 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。