人工智能的几个新开源模型

当人工智能模型每天发布时,很难跟上。人工智能商业展示了过去几周你可能错过的几个个最重要的模型。

在这里插入图片描述

苹果的OpenELM

它是开源的吗?对
OpenELM见证了苹果公司加入越来越多开发开源人工智能系统的公司行列。
这家iPhone制造商在开源人工智能领域相对较新,OpenELM标志着其首款机型的发布。上个月,该公司推出了一款名为MM1的多模式人工智能系统。
OpenELM是开源高效语言模型的缩写,它的规模很小。它的大小从2.7亿个参数到30亿个参数不等。

OpenELM有两种类型,一种是预训练版本,另一种是经过指令调优的版本,适合于响应自然语言指令。
每一个都是在苹果新的深度神经网络库CoreNet上训练的文本生成模型,该库共包含1.8万亿个令牌。苹果公司从公开的来源获取训练数据,包括用于构建Falcon模型的RefinedWeb、去重复的PILE和Dolma v1.6语料库的子集。
苹果的模型使用创新的底层架构来提高响应的准确性,采用逐层缩放,从而在模型的每个层中更有效地分配参数。

如何访问OpenELM

苹果的OpenELM模型可以在Hugging Face上找到,而CoreNet库可以在GitHub上找到。
苹果的OpenELM型号可以用于为商业应用程序供电。然而,与传统开源机型相比,该许可证要严格得多,需要遵守特定的条款,包括避免暗示苹果的认可。

雪花的北极

它是开源的吗?对
Snowflake最近推出了Arctic,该公司声称这是“最开放的企业级大型语言模型”
Arctic是一个为企业设计的大型语言模型。它有170亿个参数,所以运行不需要巨大的电力。
该模型旨在熟练地遵循指令并执行代码生成等任务,同时与其他开源模型相比,运行起来更具成本效益。
相关:Meta推出迄今为止最强大的开源模型Llama 3
用户还可以在Arctic上构建,设计针对特定企业用例优化的自定义模型。
Arctic在以企业为中心的基准测试中,与Meta新Llama 3的80亿参数版本等更昂贵的运行模型相比,表现不相上下或更好。Snowflake声称其新型号的运行成本只有其一半。
与Meta的竞争对手不同,Snowflake标榜其北极模型是真正开放的,因为用户可以访问该模型、其重量、代码以及用于为其供电的所有数据配方。
Meta没有披露用于训练其最新Llama模型的数据集,尽管它已经开放了访问权限。

微软的Phi-3 Mini

它是开源的吗?对
作为微软最新的小型语言模型,Phi-3 Mini的尺寸只有38亿个参数,但其性能是其尺寸的两倍多。
与之前的Phi模型相比,新模型拥有改进的推理、编码和数学能力。
这是第一个拥有高达128K个令牌的上下文窗口的小型模型,小型模型能够在不影响响应质量的情况下处理大量输入。
Phi-3可以开箱即用,因为它经过了指令调整,这意味着它适合于需要从一开始就遵循指令的部署。
由于体积小,Phi-3 mini可以用于智能手机或工业环境中的传感器等边缘应用程序。
微软去年12月才推出Phi-2,但仍在继续进行小型机型开发。
微软负责生成人工智能的首席产品经理Sonali Yadav表示:“我们将开始看到的不是从大到小的转变,而是从单一类别的模型向一系列模型的转变,在这些模型中,客户能够决定什么是最适合他们场景的模型。”。
进一步的Phi-3模型正在进行中,Phi-3小型(70亿参数)和Phi-3中型(140亿参数)将在“未来几周”推出
如何访问Microsoft Phi-3
新的Phi-3迷你模型可在Azure AI Studio、Hugging Face和Ollama上使用。
它也可以在Nvidia的Nim平台上使用,带有标准的API接口,可以部署在任何地方。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值