llama2, llama3, llama3.1比较

茫茫人海一粒沙

已于 2024-07-28 23:24:01 修改

阅读量7.3k

点赞数 6

文章标签： llama

于 2024-04-21 22:26:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/keeppractice/article/details/138039466

版权

Llama 3 刚刚在4月18号推出，距 Llama 2 发布正好 9 个月。它已经可以在 Meta 网站上进行聊天，可以从 Huggingface 以 safetensors 或 GGUF 格式下载。

llama 2 与 llama3 比较

1. 模型输出（model output）

llama 2 输出只能是文本（Models generate text only.），llama 3既可以输出文本也可以输出代码（generate text and code only.）。 llama3.1 增加了工具调用功能（tool calling）

2. longer context windows.

Llama 3 还将上下文窗口大小从 4k 标记增加到 8k 标记。

llama 3.1 上下窗口大小是148K

3. Tokenizer

Llama 3 的Token 的数量从2T 增加到了15T+。

Llama3.1 的token的数量是15T+
Llama 2 使用 SentencePiece 进行标记化，而 Llama 3 已过渡到 OpenAI 的 Tiktoken。 Llama 3 还引入了 ChatFormat 类、特殊令牌（包括回合结束标记的令牌）和其他功能，以增强对基于聊天的交互和对话处理的支持。

4. 不同nlp的任务上的性能比较

基础预训练模型(Base pretrained models) 比较llama2 vs llama3。

可以看出即使是llama3 8B 预训练模型在一些任务上也比llama2 7B 和13B的模型好很多。

虽然参数只是多了1B.

用命令调整过的模型（Instruction tuned models）比较llama2 vs llama3

llama 3 与llama 3.1 的基础训练模型比较

用命令调整过的模型（Instruction tuned models）比较llama3 vs llama3.1

参考资料

https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct/tree/main

https://ai.meta.com/blog/meta-llama-3/

https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

llama-models/models/llama3_1/MODEL_CARD.md at main · meta-llama/llama-models · GitHub

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

茫茫人海一粒沙 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。