大模型学习笔记 - LLM 之 LLaMA系列（待更新）

JL_Jessie

于 2024-08-22 22:56:38 发布

阅读量224

点赞数 1

文章标签：学习笔记 llama

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37531129/article/details/141439936

版权

LLaMA 系列
- LLaMA 概述

LLaMA 概述

LLaMA: Open and Efficient Foundation Language Models
Llama 2: Open Foundation and Fine-Tuned Chat Models (LLama2 & LLama2-Chat)
LLama 3 | LLama 3.1

LLaMA-1

涉及到的基础知识点:

pre-normalization. RSMNorm。
SwiGLU activation function [PaLM].
Rotary Embeddings [GPTNeo].Rotary positional embeddings (RoPE),
FlashAttention

LLaMA-2

涉及到的基础知识点:

groupAttention
RLHF(PPO，拒绝采样)

LLama2:
我们还将预训练语料库的大小增加了 40%，增加了模型的上下文长度，并采用分组查询注意力（Ainslie et al., 2023）。我们正在发布具有 7B、13B 和 70B 参数的 Llama 2 变体。

LLama2Chat:
Llama 2-Chat 的训练：这个过程始于使用公开可用的在线源对 Llama 2 进行预训练。接下来，我们通过应用监督微调来创建 Llama 2-Chat 的初始版本。随后，使用带有人类反馈 (RLHF) 方法的强化学习迭代地改进模型，特别是通过拒绝采样和近端策略优化 (PPO)。在 RLHF 阶段，迭代奖励建模数据与模型增强并行的累积对于确保奖励模型保持在分布内至关重要。

在这里插入图片描述

LLaMA-3

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
大模型学习笔记 - LLM 之 LLaMA系列（待更新）

LLaMA: Open and Efficient Foundation Language ModelsLlama 2: Open Foundation and Fine-Tuned Chat Models (LLama2 & LLama2-Chat)LLama 3 | LLama 3.1涉及到的基础知识点:涉及到的基础知识点:LLama2:我们还将预训练语料库的大小增加了 40%，增加了模型的上下文长度，并采用分组查询注意力（Ainslie et al., 2023）。我们正在发布具有 7B、13
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。