The Llama 3 Herd of Models【论文原文下载】

最新推荐文章于 2025-05-20 15:38:25 发布

hallo128

最新推荐文章于 2025-05-20 15:38:25 发布

阅读量580

点赞数 9

文章标签： llama

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43633501/article/details/141897160

版权

关注B站可以观看更多实战教学视频：hallo128的个人空间

The Llama 3 Herd of Models【论文原文】

点击下载：原文下载链接

摘要

现代人工智能（AI）系统由基础模型驱动。本文介绍了一组新的基础模型，称为 Llama 3。它是一群原生支持多语言、编码、推理和工具使用的语言模型。我们最大的模型是一个密集型 Transformer，具有 405 B {405}\mathrm{;B}405B 参数和高达 128 K {128}\mathrm{;K}128K 个令牌的上下文窗口。本文对 Llama 3 进行了广泛的实证评估。我们发现 Llama 3 在众多任务上与 GPT-4 等领先语言模型相比质量相当。我们公开发布了 Llama 3，包括 405B 参数语言模型的预训练和后训练版本以及用于输入和输出安全的 Llama Guard 3 模型。本文还展示了通过组合方法将图像、视频和语音功能集成到 Llama 3 中的实验结果。我们观察到这种方法在图像、视频和语音识别任务上与最先进的技术表现竞争。由于这些模型仍在开发中，因此尚未广泛发布。

日期：2024年7月23日

网站：https://llama.meta.com/

在这里插入图片描述

点击下载：原文下载链接

博客等级

码龄7年

97
原创

691
点赞

578
收藏

459
粉丝

关注

私信

热门文章

分类专栏

sci 7篇
创作
机器人 4篇
扩散模型 9篇
文献阅读 1篇
环境搭建 4篇
kaggle 1篇
LLM 5篇
鲁棒训练 1篇
VP 1篇
SDE 1篇
AI绘画 2篇
C++ 1篇
数据结构 8篇
R 2篇
机器学习 4篇
Python 7篇
数据分析 3篇

展开全部收起

最新评论

机器人研究不同模态之间的融合方法
征途黯然.: I've learned a lot from this article about 机器人研究不同模态之间的融合方法; it has great depth.
np.concatenate在图像处理中的使用
普通网友: 感谢大佬分享好文，学到了不少新知识，支持大佬，期待大佬持续输出优质文章！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
BytesIO使用说明
CSDN-Ada助手: 恭喜用户撰写了第20篇博客《BytesIO使用说明》，内容详实而有深度，让读者受益匪浅。继续努力保持创作的热情与耐心，不断提升自身的写作水平和表达能力。或许下一步可以尝试结合实际案例或者个人经验，让读者更加容易理解和接受，期待您更多精彩的作品！
提取Canny边缘
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Stable diffusion: AttributeError: module ‘jax.random‘ has no attribute ‘KeyArray‘
CSDN-Ada助手: 恭喜您发布了第19篇博客！看到您在解决Stable diffusion过程中遇到的问题，我感到您的专业知识和解决问题的能力真的令人钦佩。不过，关于AttributeError: module ‘jax.random‘ has no attribute ‘KeyArray‘的问题，我也稍有了解，或许您可以尝试查找更多相关资料或请教其他专家，以便更快地解决这个问题。期待您的下一篇博客，继续分享您宝贵的经验和见解！加油！

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。