鼓吹开源无前途,Meta却开源了Llama 3模型,无需注册在线即可使用

Meta AI一直是人工智能领域开源领域的领导者,一边是OpenAI鼓吹闭源才是人工智能大模型的未来,但是Meta AI却开源了自己的Llama 3大模型,且Llama 3开源模型支持80亿与700亿参数,而未来更大的4000亿参数大模型还在继续训练中。其Llama 3大模型可以直接在Meta AI官网直接使用,且支持无需注册登陆即可使用,简直是开箱即用。

动图封面

Meta AI Llama3

Llama 3 模型简介

Llama 3是Meta AI开源的第三代Llama系列模型,其新的 8B 和 70B 参数 Llama 3 模型在Llama 2的基础上,实现了更大性能的提升。由于预训练和训练后的技术改进,其Llama 3模型是当今 8B 和 70B 参数规模的最佳模型。Llama 3模型的改进大大降低了错误拒绝率,改善了一致性,并增加了模型响应的多样性。Llama 3模型在推理、代码生成和指令跟踪等功能也得到了极大的改善

Llama 3模型与其他模型参数对比

在 Llama 3 的开发过程中,为了优化现实场景的性能。Meta AI开发了一套新的高质量人类评估数据集。此数据集包含 1800 个提示,涵盖 12 个关键用例:寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、塑造角色、开放式问答、推理、重写和总结。

Claude Sonnet、Mistral Medium 和 GPT-3.5 对比结果

为了打造更加强大的Llama 3大模型,Meta AI分别在模型架构、预训练数据、扩大预训练和指令微调四个方面进行了创新调整。

模型架构

Llama 3 中选择了相对标准的仅解码器 Transformer 架构。与 Llama 2 相比,Llama 3 使用具有 128K 标记词汇表的标记器,可以更有效地对语言进行编码,从而显著提高模型性能。为了提高 Llama 3 模型的推理效率,在 8B 和 70B 大小上采用了分组查询注意力 机制(GQA)。不得不说,transformer依然是大模型的天下。

预训练数据集

为了提高训练效果,除了Meta AI自行设计的数据集外,Llama 3训练数据集比 Llama 2 使用的数据集大七倍,并且包含四倍多的代码。为了多语言模型,超过 5% 的 Llama 3 预训练数据集由涵盖 30 多种语言的高质量非英语数据组成。为了确保 Llama 3 接受最高质量数据的训练,Meta AI开发了一系列数据过滤器,包括使用启发式过滤器、NSFW 过滤器、语义重复数据删除方法和文本分类器等等,以便得到更加高质量的预训练数据集。

扩大预训练规模

为了训练最大参数的 Llama 3 模型,Meta AI使用数据并行化、模​型并行化和管道并行化的方式对模型进行训练。当同时在 16K GPU 上进行训练时,可实现每个 GPU 超过 400 TFLOPS 的计算利用率。且Meta AI设计了自动检测错误规则,自动纠正规则,让模型总体有效训练时间超过95%,其效率比Llama 2 大大提高了3倍之多。

模型性能对比

指令微调

通过监督微调(SFT)、拒绝采样、近端策略优化(PPO)和直接策略优化(DPO)的组合方法进行模型的微调,让Llama 3 模型在推理以及编码性能上得到了大大的提升。通过 PPO 和 DPO 从偏好排名数据中学习也极大地提高了 Llama 3 在推理和编码任务上的性能。如果你向模型提出一个它难以回答的推理问题,该模型有时会产生正确的推理轨迹,得到正确的答案。

Llama 3 模型使用

Llama 3 模型将在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 上推出。可以直接在以上平台上直接使用Llama 3 模型,当然也可以直接在Meta AI的官网直接使用,且无需任何登陆注册步骤,只要能登陆网站,就可以使用。

系统安全设计规则

Llama 3 模型的使用直接在Meta AI官网使用,其官网使用的就是Llama 3模型。

Meta AI使用Llama3

Llama 3 模型虽然没有说支持中文,但是当你输入中文跟他聊天时,模型依然可以正常回答。

Llama 3 示例

但是回答的是英文,若让模型翻译成中文,或者中文回答,模型依然可以用中文回答,但是网站上立马就转换成了英文。要不是立马截图,还真以为模型不懂中文。

中文回答截图

Meta 认为,开源其模型可以促进社区驱动的创新,使开发人员能够在技术的基础上进行开发和改进。开源模型展示了对技术的透明度和信任,使用户能够了解模型的工作原理并做出明智的决策。Meta 旨在通过开源模型,加速人工智能研发进程,造福更广泛的人工智能社区。开源模型减少了重复工作,因为开发人员可以在现有模型的基础上进行构建,而不是从头开始。

你觉得开源是未来,还是闭源?

Meta AI

https://ai.meta.com/blog/meta-llama-3/
https://www.meta.ai/
https://llama.meta.com/docs/get-started/
更多transformer,VIT,swin tranformer
参考头条号:人工智能研究所
v号:启示AI科技
微信中复制如下链接,打开,免费使用chatgpt
 
https://wx2.expostar.cn/qz/pages/manor/index?id=1137&share_from_id=79482&sid=24

Llama 3 模型已经开源,任何人都可以使用Llama 3 模型开发自己的应用,且Meta AI官方提供了详细说明,可以按照相关说明进行Llama 3 模型的开发使用。

 动画详解transformer  在线教程

  • 13
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能研究所

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值