Llama 3技术剖析、微调、部署以及多模态训练

最新推荐文章于 2024-08-26 16:25:01 发布

风度78

最新推荐文章于 2024-08-26 16:25:01 发布

阅读量256

点赞数

文章标签： llama

原文链接：https://mp.weixin.qq.com/s?__biz=MzIwODI2NDkxNQ==&mid=2247517438&idx=1&sn=831d7b5242823aceaf2a0d410f82fb37&chksm=966097a14d1b5d15390a9e0849b69e9cef941e620c2ce8c975e53b67b9f1c2487da5108cba39&scene=126&sessionid=0

版权

Meta公司推出了开源大语言模型Llama系列的最新产品—Llama 3，包含了80亿参数的Llama 3 8B和700亿参数的Llama 3 70B两个版本。Meta称其为“迄今为止最强的开源大模型”。

Meta官方数据显示，Llama 3 8B模型在MMLU、GPQA、HumanEval等多项基准上均胜过同参数量级模型Gemma 7B和Mistral 7B Instruct，而70B模型则超越了闭源的当红模型Claude 3 Sonnet，并且效果上完全能与Google的Gemini Pro 1.5掰掰手腕。

那Llama 3在结构上跟之前的版本有哪些区别？它的预训练和Post训练是如何进行的？如何对Llama 3进行微调？基于Llama 3是否能构建出更优质的多模态大模型？鉴于这些问题，我们特意组织了一次对Llama 3的免费公开课，前面剖析它的技术层面以及应用。

1. 不仅剖析原理，更有实操案例分享

本次公开课主题是《Llama 3技术剖析、微调以及多模态训练》，将剖析Llama 3的核心技术，讲解如何基于Llama 3进行模型的微调和多模态模型训练和微调。本次公开课不仅会讲解技术理论，也包括了结合Llama 3的模型微调和多模态大模型微调两个项目Case，从应用角度让大家对Llama 3的效果有直观的理解。

2. 公开课大纲

Llama 3结构剖析、与Llama2区别
Pretrain技术解释：GQA, RoPE等
Postrain技术解释：SFT, PPO, DPO等
Case：基于Llama 3-8B模型微调和部署
多模态大模型结构如Mini-Gemini、LLaVA
Case: 结合LLama 3的多模态大模型微调

3. 分享嘉宾

李老师

人工智能、大模型领域专家

多家上市公司技术战略顾问
曾任金融科技独角兽公司首席科学家
曾任量化投资初创公司首席科学家
曾任美国亚马逊推荐系统工程师
深耕AI领域十余年，授课培养AI学员数万人

4. 时间安排

北京时间：2024年4月29日，20:00-22:00

5. 适合人群

想学习大模型及微调的开发工程师
想深入理解相关技术的算法工程师

即将开始

立即扫码添加老师，免费参加~

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。