“开源AI”到底是什么意思-CSDN博客

本文链接：https://blog.csdn.net/Him__/article/details/139918129

开源与专有软件之间的斗争早已为人所熟知。然而，长期以来弥漫在软件圈的紧张关系已经渗透到了人工智能领域，部分原因在于没有人能在AI背景下就“开源”的真正含义达成一致。

相关阅读：GPT-4o通过整合文本、音频和视觉实现人性化的AI交互，OpenAI推出了其新的旗舰模型GPT-4o，它无缝整合了文本、音频和视觉输入与输出，有望提高机器交互的自然性。现在Plus用户可以直接使用GPT-4o，关于如何开通Plus，可以使用WildCard平台。或者可以使用镜像站，已实现所有功能（包括实时语音对话）。

《纽约时报》最近发表了一篇对Meta CEO马克·扎克伯格的溢美之词，指出他对“开源AI”的拥抱使他在硅谷重新受欢迎。然而，大多数估计认为，Meta的Llama品牌的大型语言模型并不是真正的开源，这突显了争论的核心。WildCard也支持Claude, Midjourney, Adobe, Patreon， Midjourney, OF, X等的订阅。

正是这一挑战促使开源倡议（OSI）试图解决这个问题，其执行董事斯特凡诺·马夫弗利（如上图）通过会议、研讨会、小组讨论、网络研讨会、报告等方式进行努力。

AI不是软件代码

OSI已经管理开源定义（OSD）超过四分之一个世纪，规定了“开源”一词在软件中的适用和应当应用的方式。符合这一定义的许可证可以合法地被认为是“开源”，尽管它承认存在从极其宽松到不那么宽松的许可证谱系。

但将软件中的遗留许可和命名惯例移植到AI上是有问题的。开源倡导者、风投公司OSS Capital创始人约瑟夫·杰克斯甚至表示，“不存在开源AI这种东西”，指出“开源是专为软件源代码发明的。”进一步说，“神经网络权重”（NNWs）——这是人工智能领域用来描述在训练过程中网络学习的参数或系数的术语——在任何有意义的方式上都无法与软件相比。

“神经网络权重不是软件源代码；它们对人类不可读，也无法调试，”杰克斯指出。“此外，开源的基本权利也不能以任何一致的方式转移到NNWs上。”

正是这些不一致性去年促使杰克斯和OSS Capital同事希瑟·米克尔提出了自己的定义，围绕“开放权重”的概念展开。马夫弗利对此也表示赞同。“这个观点是正确的，”他告诉TechCrunch。“我们最初的辩论之一是是否要将其称为开源AI，但每个人都已经在使用这个术语了。”

Meta分析

成立于1998年的OSI是一家非营利公共利益公司，围绕倡导、教育和其核心存在理由：开源定义，进行各种开源相关活动。如今，该组织依靠赞助进行资助，其成员包括亚马逊、谷歌、微软、思科、英特尔、Salesforce和Meta等。

Meta目前与OSI的关系尤其值得注意，因为它涉及到“开源AI”的概念。尽管Meta将其AI挂在开源的名义上，但该公司对其Llama模型的使用有显著的限制：当然，它们可以免费用于研究和商业用途，但每月用户超过7亿的应用开发者必须向Meta申请特别许可证，而Meta将完全自行决定是否授予该许可证。

Meta对其LLMs的语言有些灵活。虽然公司确实称其Llama 2模型为开源，但随着Llama 3的到来，该公司在术语上有所退缩，使用了“开放可用”和“开放可访问”等短语。然而，在某些地方，它仍将该模型称为“开源”。

“参与讨论的每个人都完全同意Llama本身不能被视为开源，”马夫弗利说。“我与Meta工作的人的对话中，他们知道这有点牵强。”

此外，有人可能会认为这里存在利益冲突：一家希望借用开源品牌的公司同时也为“定义”的管理者提供资金？

这也是OSI试图多样化其资金来源的原因之一，最近获得了斯隆基金会的资助，帮助其推动全球多方利益相关者达成开源AI定义。TechCrunch透露，这笔资助约为25万美元，马夫弗利希望这能改变其对企业资金依赖的印象。

“这正是斯隆资助使之更加清晰的事情之一：我们随时可以告别Meta的钱，”马夫弗利说。“即使在斯隆资助之前，我们也可以做到这一点，因为我知道我们将获得其他人的捐赠。Meta非常清楚这一点。他们没有干涉这一过程，微软、GitHub、亚马逊或谷歌也没有干涉——他们绝对知道他们不能干涉，因为组织的结构不允许这样做。”