Llama3技术报告

最新推荐文章于 2024-10-07 06:31:57 发布

WF19980719

最新推荐文章于 2024-10-07 06:31:57 发布

阅读量261

点赞数 1

文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wf19980719/article/details/140949096

版权

Model architecture

standard decoder-only transformer
Compared to Llama 2, we made several key improvements:

Llama 3 uses a tokenizer with a vocabulary of 128K tokens that encodes language much more efficiently
To improve the inference efficiency of Llama 3 models, we’ve adopted grouped query attention (GQA) across both the 8B and 70B sizes
We trained the models on sequences of 8,192 tokens, using a mask to ensure self-attention does not cross document boundaries.

Instruction fine-tuning

supervised fine-tuning (SFT)
rejection sampling
proximal policy optimization (PPO)
direct preference optimization (DPO)：the preference rankings that are used in PPO and DPO has an outsized influence on the performance of aligned models

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

WF19980719 CSDN认证博客专家 CSDN认证企业博客

码龄5年

43: 原创

46万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

654: 积分

125: 粉丝

230: 获赞

8: 评论

167: 收藏

私信

关注

热门文章

分类专栏

考研 1篇
CCF 2篇
算法 16篇
PAT 11篇

最新评论

大模型PEFT(二) 之大模型LoRA指令微调实践
z2498249: UserWarning: Could not find a config file in ./Qwen/Qwen1.5-0.5B - will assume that the vocabulary was not modified. 这是什么问题，有没有什么影响
大模型PEFT(二) 之大模型LoRA指令微调实践
普通网友: 这篇文章真是一篇佳作!作者运用了生动有趣的语言,将枯燥的理论知识娓娓道来,让人如沐春风。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
工位ubuntu的配置
君王的羔羊: module.c:66) fcitx-sogoupinyinhxm abi version error这个问题有解决吗。搜狗输入法无法正常使用
python
普通网友: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，期待博主持续带来更多好文【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Neural_Nano-Optics-master
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。