Meta发布开源人工智能模型Llama 3.1-CSDN博客

本文链接：https://blog.csdn.net/2301_76161259/article/details/140696909

早在今年4月，Meta就透露说，它正在开发人工智能行业的第一款产品:一个性能与OpenAI等公司最好的私有模型相媲美的开源模型。

今天，该大模型已经问世。Meta发布 Llama 3.1，这是有史以来最大的开源人工智能模型。Meta声称，Llama 3.1在几个基准测试上的表现优于gpt-4o和Anthropic的Claude 3.5 Sonnet。

Llama 3.1还在更多国家和语言中提供基于 Llama 的 Meta 人工智能助手，同时增加了一项功能，可以根据某人的特定形象生成图像。首席执行官马克·扎克伯格预测，Meta AI 将在今年年底超过 ChatGPT成为使用最广泛的人工智能助手。

Llama 3.1 比几个月前推出的较小的 Llama 3 模型要复杂得多。最大版本拥有 4050 亿个参数，并使用了超过 16000 个英伟达极其昂贵的 H100 GPU 进行训练。Meta 没有透露开发 Llama 3.1 的成本，但仅根据英伟达芯片的成本计算，保守估计也有数亿美元。

那么，考虑到成本，为什么 Meta 继续以只需拥有数亿用户的公司批准的许可证免费提供 Llama 呢？在 Meta 公司博客上发表的一封信中，扎克伯格认为，开源人工智能模型将超越——并且已经比——专有模型改进得更快，类似于 Linux 如何成为为当今大多数手机、服务器和小工具提供动力的开源操作系统。

马克·扎克伯格将 Meta 在开源人工智能方面的投资与早期的开放计算项目进行了比较，他说，在建立自身能力时，让像惠普这样的外部公司帮助改进和标准化 Meta 的数据中心设计，为公司节省了数十亿美元。展望未来，他预计人工智能也会出现同样的动态，写道：“我相信 Llama 3.1 的发布将是行业的一个转折点，大多数开发者开始主要使用开源。”

为了帮助 Llama 3.1 走向世界，Meta 正在与包括微软、亚马逊、谷歌、英伟达和 Databricks 在内的二十多家公司合作，帮助开发者部署自己的版本。Meta 声称，Llama 3.1的生产成本大约是OpenAI gpt - 4o的一半。Meta正在发布模型权重，以便公司可以在自定义数据上对其进行训练，并根据自己的喜好进行调整。

不出所料，Meta并没有透露太多用于训练Llama 3.1的数据。据人工智能行业公司的工作人员表示，Meta不披露这些信息是因为这是商业机密，而批评人士则表示，这是一种策略，旨在拖延不可避免的版权诉讼冲击。

Meta透露，它使用了合成数据，即由模型而非人类生成的数据，让拥有 4050 亿参数的 Llama 3.1 版本改进了较小的 700 亿和 80 亿版本。Meta 生成式人工智能副总裁Ahmad Al-Dahle预测，Llama 3.1 作为用于培训随后部署的较小模型的老师将受到开发者的欢迎，以更具成本效益的方式。

当询问 Meta 是否同意行业中关于模型的优质训练数据即将耗尽这一日益增长的共识时，Ahmad Al-Dahle表示即将达到上限，尽管可能比一些人认为的要晚。他说：“我们绝对认为我们还有几次（训练）运行，但很难说。”

这是 Meta 首次对 Llama 3.1 的红队测试（或对抗性测试）包括寻找潜在的网络安全和生化用例。更严格测试该模型的另一个原因是 Meta 所描述的新兴智能行为。

例如，Ahmad Al-Dahle，Llama 3.1 能够与搜索引擎 API 集成，“根据复杂的查询从互联网检索信息，并连续调用多个工具以完成您的任务”。他给出的另一个例子是要求模型绘制过去五年美国售出房屋的数量。它可以为您检索（网络）搜索并生成 Python 代码并执行它。

Meta自己对Llama的实现是它的人工智能助手，它被定位为像ChatGPT一样的通用聊天机器人，可以在 Instagram、Facebook 和 WhatsApp 的几乎每个部分找到。从本周开始，Llama 3.1 将首先通过美国的 WhatsApp 和 Meta AI 网站访问，随后几周内将在 Instagram 和 Facebook 上推出。它正在更新以支持新语言，包括法语、德语、印地语、意大利语和西班牙语。

虽然 Llama 3.1 最先进的 4050 亿参数模型在 Meta AI 中可免费使用，但在给定的一周内超过未指定数量的提示后，助手将切换到规模较小的 700 亿模型。这表明 4050 亿模型对于 Meta 来说全面运行成本过高。发言人Jon Carvill表示，公司将在评估早期使用情况后提供有关提示阈值的更多信息。

Meta AI 中的新Imagine Me功能通过您手机的摄像头扫描您的面部，然后让您将自己的形象插入其生成的图像中。通过这种方式捕捉您的形象，而不是通过您个人资料中的照片，Meta 有望避免创建深度伪造机器。该公司看到了人们对创建更多种类的人工智能媒体并分享到其动态的需求，即使这意味着模糊真实与不真实之间的界限。

Meta AI 也将在未来几周内登陆 Quest 头戴设备，取代其语音命令界面。就像它在 Meta Ray-Ban 眼镜中的实现一样，当您处于头戴设备的直通模式（通过显示屏显示现实世界）时，您将能够在 Quest 上使用 Meta AI 来识别和了解您正在查看的内容。

除了马克·扎克伯格预测 Meta AI 将在今年年底成为使用最广泛的聊天机器人（ChatGPT拥有超过1亿用户）之外，Meta 尚未分享其助手的任何使用数据。“我认为整个行业在实现产品与市场匹配的道路上仍处于早期阶段，”Ahmad Al-Dahle说。尽管人工智能已经感觉有些过度炒作，但很明显，Meta 和其他参与者认为这场竞赛才刚刚开始。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：