Meta Llama 3 来啦！性能算力究竟如何？

慧星云

已于 2024-05-15 15:40:17 修改

阅读量1.1k

点赞数 26

文章标签： llama 云计算人工智能机器人

于 2024-04-19 15:35:04 首次发布

本文链接：https://blog.csdn.net/holdcloud/article/details/137967113

版权

Meta公司发布了Llama3，包括8B和70B两种模型，将在多个平台上线，适用于不同场景。Llama3在性能上表现出色，尤其在真实场景优化方面。此外，文章提及了算力云平台厚德云对于强大模型开发的重要性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

新一代大语言模型 Meta Llama 3 横空出世！

前言

就在4月19日，Meta公司推出了他们最新开源的大型语言模型(LLM) Llama 3！这次的Llama 3包含了8B和70B两种不同参数规模的模型。那么作为Llama的第三代模型它的表现究竟如何呢？我们接着往下看。

了解Llama 3

作为一款新的大语言模型，大家最关注的肯定是他会在哪些平台上线。根据Meta官方宣布，Llama 3模型将在AWS / Databricks / Google Cloud / Hugging Face / Kaggle / IBM WatsonX / Microsoft Azure / NVIDIA NIM / Snowflake等多平台推出！这也代表着无论你是哪种用户，都有机会跳入技术飞跃的怀抱，一探AI技术的惊喜变革！

从目前来看，Llama 3 的8B版本可以适用于快速推理或需要少量计算资源的场景，而70B这一版本则是用于面对深层次的语言理解和生成，据Meta官方表示，他们之后还会推出拥有400B参数的模型，目前还在训练阶段。

性能比较

从Meta官方给出的数据报告来看，由于预训练和训练后的改进，预训练和指令微调模型是当今 8B 和 70B 参数规模的最佳模型。

不仅如此，Meta官方还研究了标准基准测试下的模型性能，并试图针对真实场景的性能进行优化。为此，他们开发了一套新的高质量人体评估集。该评估集包含 1,800 个提示，涵盖 12 个关键用例：寻求建议、头脑风暴、分类、封闭式问答、编码、创意写作、提取、栖息角色/角色、开放式问答、推理、重写和总结。

上图显示了他们对这些类别的人工评估的汇总结果，并针对 Claude Sonnet、Mistral Medium 和 GPT-3.5 进行了提示。可以看出来Llama 3的数值对比都是比较出色的。