开源大模型Llama会失去技术优势吗？

最新推荐文章于 2024-09-12 21:00:04 发布

开源社

最新推荐文章于 2024-09-12 21:00:04 发布

阅读量51

点赞数

文章标签：开源 llama

原文链接：https://mp.weixin.qq.com/s?__biz=MzA4NTM4NDc4NQ==&mid=2247538110&idx=1&sn=72f2221eb970ae57cbaf142340024693&chksm=9e52c826979fc05c256306fa07426dac263cb74bc3c5901844a2e910f95e5bf42c8ec620226d&scene=126&sessionid=0

版权

昨夜，Meta 宣布推出迄今为止最强大的开源模型—— Llama 3.1 405B ，支持上下文长度为128K Tokens ，在基于15万亿个 Tokens 、超1.6万个 H100 GPU 上进行训练，这也是 Meta 有史以来第一次以这种规模训练 Llama 模型。Meta 同时还发布了全新升级的 Llama 3.1 70B 和8B 模型。Llama 3.1 405B 研究人员基于超150个基准测试集的评测结果显示，Llama 3.1 405B 可与 GPT-4o 、 Claude 3.5 Sonnet 和 Gemini Ultra 等头部模型媲美。

Meta 公司 CEO 马克·扎克伯格撰写长文，除宣布发布 Llama 3.1 模型外，还阐述开源 AI 的重要性。他表示，这些模型具有高性能、开放性和可定制性，并得到广泛生态系统的支持。“我们发布了 Llama 3.1 405B ，这是第一个前沿级别的开源人工智能模型。除了与闭源模型相比具有显著更好的性能比之外，405B 模型的开放性将使其成为微调和蒸馏更小模型的最佳选择。”

扎克伯格以 Linux 操作系统取代闭源 Unix 为例，提出开源 AI 将凭借开放性、可修改性和成本效益优势，超越闭源模型，成为行业主流的观点。“当你考虑未来的机遇时，请记住，当今大多数领先的科技公司和科学研究都是建立在开源软件之上的。如果我们共同投资，下一代公司和研究将使用开源人工智能”。

扎克伯格提到，与世界各地的开发者、首席执行官和官员交谈时，通常会听到几个观点。

第一，用户需要训练、微调和蒸馏自己的模型。每个用户用对模型的规模都有其独特的需求，期望这些模型可以根据其特定的数据进行训练或微调。对于设备上的任务和分类任务，小模型足矣；而对于更加复杂的任务，则需要大模型。“现在，你可以利用最先进的 Llama 模型，用你自己的数据继续训练它们，然后将它们蒸馏成一个最适合你需要的模型尺寸——而无需让我们或任何其他人看到你的数据”。扎克伯格说。

第二，用户需要控制自己的命运，不想被闭源模型供应商限制。许多用户不希望依赖其无法自行运行和控制的模型。他们不希望闭源模型提供者能够更改模型、修改使用条款，甚至完全停止服务。用户也不想被限制在只有一个云平台拥有模型独家使用权。“开源允许广泛的公司生态系统拥有兼容的工具链，使你可以轻松地在它们之间迁移”。

第三，用户需要保护自己的数据安全。许多用户处理敏感数据时需要加以保护，不能通过闭源模型的云 API 发送。还有一些用户根本不信任闭源模型提供者处理他们的数据。“开源通过允许你在任何地方运行模型来解决这些问题。普遍认为，开源软件通常更安全，因为它的开发过程更加透明”。

第四，用户需要运行效率高且能负担得起使用成本的模型。“开发者可以在自己的基础设施上，以大约使用闭源模型如 GPT-4o 一半的成本，运行 Llama 3.1 405B 的推理，无论是面向用户的还是离线推理任务”。

第五，用户希望投资能够成为长期标准的生态系统。许多用户看到开源的发展速度比闭源模型快，希望自己的系统能建立在能给他们带来最大长期优势的架构上。

扎克伯格认为开源 AI 的具有诸多优势。对开发者而言，可自定义模型、控制数据安全、降低成本、构建长期生态系统；从 Meta 的角度来看，可以避免技术锁定、促进创新、建立开源生态；从大模型发展的角度来看，可以推动技术进步，因开源模型更透明，可广泛审查，有助于提高安全性。

扎克伯格表示，开源 AI 代表着利用这项技术为每个人创造最大经济机会和安全的最佳机会，并呼吁更多人加入开源 AI 的旅程。“我相信开源对于推动人工智能未来积极发展至关重要。人工智能比任何其他现代技术都有更大的潜力来提升人类的生产力、创造力和生活质量——并加速推动经济增长，同时推动医学和科学研究的进步。开源将确保全球更多的人能够享受人工智能带来的好处和机会，权力不会集中在少数公司手中，技术可以更均匀、更安全地在社会中部署”。

Meta 承诺将继续推动开源 AI 的发展，与社区和合作伙伴合作，构建更广泛的生态系统。

除了发布这些模型外，扎克伯格表示 Meta 正与一系列公司合作，以发展更广泛的生态系统。亚马逊、 Databricks 和英伟达正在推出一整套服务，支持开发者微调和蒸馏自己的模型。像 Groq 这样的创新者已经为所有新模型构建了低延迟、低成本的推理服务。这些模型将在所有主要云平台上提供，包括 AWS 、Azure 、 Google 、 Oracle 等。像 Scale.AI 、Dell 、德勤等公司已准备好帮助企业采用 Llama ，并用他们自己的数据训练定制模型。“随着社区的增长和更多公司开发新服务，我们可以共同使 Llama 成为行业标准，将 AI 的好处带给每个人”。

Meta 为什么要致力于开源人工智能？开源 Llama 会失去技术优势吗？“我认为开源是最好的开发堆栈，是一个长期可持续的平台。”扎克伯格说。首先，为了确保 Llama 能够获取最佳技术，并且长期不会被锁定在闭源生态系统中， Llama 需要发展成为一个完整的工具生态系统，包括效率提升、硅片优化和其他集成。“如果我们是唯一使用 Llama 的公司，这个生态系统就不会发展起来，我们的表现也不会比 Unix 的闭源版本更好”。

其次，人工智能非常具有竞争力，这意味着开源任何特定模型并不会在当时具有比下一个最佳模型更大的优势。“ Llama 成为行业标准的道路是通过持续保持竞争力、效率和开放性，一代又一代地发展”。

再次， Meta 与闭源模型提供者的一个关键区别在于，出售对人工智能模型的访问并不是 Llama 的商业模式。“这意味着公开发布 Llama 并不会削弱我们的收入、可持续性或研究投资能力，而这对于闭源提供者来说则不然”。

最后， Meta 有着长期的开源项目和成功的历史。“我们通过发布服务器、网络和数据中心设计，并让供应链标准化设计，通过 Open Compute 项目节省了数十亿美元。我们通过开源诸如 PyTorch 、 React 等领先工具，从生态系统的创新中受益。长期坚持这种方法对我们始终有效”。

作者丨杨光

转载自丨中国信息化周报

编辑丨段延星

相关阅读 | Related Reading

从《GNU通用公共许可证》说起，让世界看到中国开源

小模型和开源正在成为AI发展的变数

开源社简介

开源社（英文名称为“ KAIYUANSHE ”）成立于 2014 年，是由志愿贡献于开源事业的个人志愿者，依 “贡献、共识、共治” 原则所组成的开源社区。开源社始终维持 “厂商中立、公益、非营利” 的理念，以 “立足中国、贡献全球，推动开源成为新时代的生活方式” 为愿景，以 “开源治理、国际接轨、社区发展、项目孵化” 为使命，旨在共创健康可持续发展的开源生态体系。

开源社积极与支持开源的社区、高校、企业以及政府相关单位紧密合作，同时也是全球开源协议认证组织 - OSI 在中国的首个成员。

自2016年起连续举办中国开源年会（COSCon），持续发布《中国开源年度报告》，联合发起了“中国开源先锋榜”、“中国开源码力榜”等，在海内外产生了广泛的影响力。