Llama 3 王者归来,第一个达到GPT-4级别的开源模型

140 篇文章 2 订阅
84 篇文章 2 订阅

7d43f11d19aa390d1bca02713e305219.jpeg Meta正式发布他们迄今最强的新一代开源大语言模型Llama3,开源模型的质量又将迎来再一次飞跃。Llama 3,包括预训练和指令调优的8B和70B两种参数的模型。Meta称Llama 3 8B 和 70B 模型只是为 Llama 3正式版所做努力的开始。他们目前正在训练的的最大型号为 400B+ 参数,预计7月推出!

性能测试: c75e8b647a670c8fd08513b09cd9af6a.jpeg 预训练和指导微调模型是目前 8B 和 70B 参数尺度上最好的模型。后期训练程序的改进大大降低了错误拒绝率,提高了对齐度,并增加了模型响应的多样性。推理、代码生成和指令跟踪等能力也有了很大提高,这使得 Llama 3 的可操控性更强。

模型架构: 

自回归语言模型:Llama 3采用自回归方法生成文本,基于优化的变换器(Transformer)架构。Grouped-Query Attention(GQA):在模型中使用了分组査询注意力机制,提高了在大规模参数下的推理可扩展性。

训练数据:

 Llama 3 在超过 15T 的词库上进行了预训练,这些词库都是从公开来源收集的。训练数据集是 Llama 2 的七倍,包含的代码数量也是 Llama 2 的四倍。为了应对即将到来的多语言使用情况,Llama 3 的预训练数据集中有超过 5% 的高质量非英语数据,涵盖 30 多种语言。开发了一系列数据过滤管道。这些管道包括使用启发式过滤器、NSFW 过滤器、语义重复数据删除方法和文本分类器来预测数据质量。

如何使用:

 详细介绍:https://ai.meta.com/blog/meta-llama-3/

模型下载:https://llama.meta.com/llama3/

在线体验:meta.ai

高性价比GPU资源:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_%E6%96%87%E7%AB%A0_tongyong_sheimei

  • 7
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值