Meta LlaMA 3模型深度解析

最新推荐文章于 2024-06-15 09:00:00 发布

奔向理想的星辰大海

最新推荐文章于 2024-06-15 09:00:00 发布

阅读量426

点赞数 5

分类专栏：技术研发架构文章标签： llama

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wjianwei666/article/details/139226977

版权

拉玛的故事

“在安第斯山脉崎岖的山区，生活着三种非常美丽的生物——里约、洛基和塞拉。它们有着光泽的皮毛和闪闪发光的眼睛，是力量和韧性的灯塔。

据说，从很小的时候起，它们对知识的渴望就永无止境。它们会寻找牛群中聪明的长者，聚精会神地听它们的故事，像海绵一样吸收它们的智慧。随着这一点的发展，它们的超能力不断增强，它们与其他动物合作，并了解到团队合作是在安第斯山脉这一充满挑战的地形上赢得选拔赛的关键。

如果它们遇到迷路或需要帮助的旅行者，里约会从它们的角度出发，安慰它们，洛基会迅速提供解决方案，而塞拉会确保它们有足够的力量继续前行。因此，它们赢得了动物族群的钦佩，并鼓励大家以它们为榜样。

当太阳在安第斯山脉上落山时，里约、洛基和塞拉站在一起，它们的精神像山脉一样交织在一起。因此，它们的故事作为知识、智慧和协作的力量以及有所作为的意愿的证明而流传至今。

它们是超级拉玛([译者注]“Llama”音译为拉玛，是一种哺乳动物，属于骆驼科，是南美洲安第斯地区的重要家畜)，它们这个三人团队被亲切地称为LlaMA3!”

Meta公司的LlaMA 3

上面的这个故事与Meta开源的大型语言模型(LLM)——LlaMA 3(大型语言模型Meta AI)的故事并不遥远。2024年4月18日，Meta发布了其8B和70B参数大小的大型语言模型LlaMa 3家族，声称这是对LlaMa 2模型的重大飞跃，并努力在这一级别的规模上竞争成为最先进的LLM模型。

Meta公司表示(https://ai.meta.com/blog/meta-llama-3/)，在构建LlaMA 3模型时，存在四个关键关注点——模型架构、预训练数据、扩展预训练和指令微调。这不由得让我们思考：如何才能从这种非常有能力的模型中获得最大收益，无论是从企业级规模上还是在基本规模级层面上。

为了帮助探索其中一些问题的答案，我与AWS生成式人工智能团队负责人Edurado Ordax和科罗拉多大学博尔德分校计算机科学专业的Tom Yeh教授展开合作。

接下来，让我们开始这趟“徒步旅行”吧……

如何利用LlaMA 3的威力?

API与微调

来自于最新的应用实践证明，访问和使用这些大型语言模型的主要方式有两种——一种是通过API调用，另一种是对现有模型进行微调。即使存在这样两种非常不同的方法，在此过程中也还存在其他方面的因素，而且这些因素可能会变得至关重要，如下图所示。

(注：本部分中的所有图片均由Eduardo Ordax提供。)

添加图片注释，不超过 140 字（可选）

归纳来看，用户与LlaMA3进行交互的方式主要分为6个阶段。

阶段1：通过按原样使用模型，以适应广泛的应用场景。

第2阶段：在用户自定义的应用程序中使用模型。

第3阶段：使用提示工程来训练模型，以产生所需的输出。

第4阶段：在用户端使用提示工程，同时深入研究数据检索和微调，这仍然主要由LLM提供商管理。

第5阶段：把大部分事情掌握在自己(用户)手中，从提示工程到数据检索和微调(RAG模型、PEFT模型等)等诸多任务。

第6阶段：从头开始创建整个基础模型——从训练前到训练后。

最低0.47元/天解锁文章

奔向理想的星辰大海

关注

5
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
Meta LlaMA 3模型深度解析

链接https://medium.com/towards-data-science/deep-dive-into-transformers-by-hand-%EF%B8%8E-68b8be4bd813处提供了有关转换器的介绍，而链接https://medium.com/towards-data-science/deep-dive-into-self-attention-by-hand-%EF%B8%8E-f02876e49857提供了有关自注意力的深入探讨文章，有兴趣的读者可以参考阅读。
复制链接

扫一扫

专栏目录

奔向理想的星辰大海 CSDN认证博客专家 CSDN认证企业博客

码龄17年

999: 原创

6353: 周排名

1309: 总排名

78万+: 访问

: 等级

1万+: 积分

6205: 粉丝

7916: 获赞

48: 评论

6213: 收藏

私信

关注

热门文章

分类专栏

最新评论

java如何判断字符串是不是中文
小王毕业啦: 博主的文章让我对“java如何判断字符串是不是中文”这个主题有了全新的认识，细节描写非常到位，让我感受到了博主的深厚功底。期待博主未来能够持续分享更多好文，同时也希望能够得到博主的指导，共同进步。非常感谢博主的分享和支持！
Spring Boot和Elasticsearch进行人脸数据的高效检索
2301_76224377: 你的博客内容深入浅出，总是让我不再感到学习的困难，每一篇博文都是我学习的宝库。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Python日志库logging总结
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh_CN/latest 使用原生 loggng封装，兼容性和替换性100%。 1、日志能根据级别能够自动变彩色。 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、兼容 loguru模式。相比 loguru 有10胜。 pip install nb_log 。
Springboot3.x 实现考试系统中接打电话的识别与处理
普通网友: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
python celery beat 实现定时任务
奔向理想的星辰大海: 多谢支持

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

奔向理想的星辰大海 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。