据报道,苹果最近在AI代码社区HuggingFace上发布了一系列名为OpenELM的大型语言模型。这些模型具有不同的参数大小,且最大的特点是可以在端侧设备上独立运行,不需要连接云端服务器。这个系列包含4个不同参数版本,分别为2.7亿、4.5亿、11亿和30亿,涵盖了从小型设备到高性能设备的需求。
与传统的大型语言模型不同,OpenELM系列模型的参数较小,这使得它们可以在笔记本电脑甚至智能手机上运行。这一特性为开发者和用户带来了更大的灵活性,允许他们在无需依赖云计算的情况下开发和使用先进的人工智能应用。
苹果在发布中提到,OpenELM系列包括4个预训练模型和4个指令调优模型。这些模型的设计旨在提供足够的性能,同时降低对硬件资源的需求。苹果还分享了一个案例,展示了其中一款模型在配备M2 Max芯片和64GB RAM的MacBook Pro上运行,操作系统为macOS 14.4.1。这一实例证明,这些模型在高端笔记本电脑上能够流畅运行。
苹果的这一举措为人工智能领域带来了新思路,特别是在端侧设备上运行大型语言模型的可能性。这将推动更多轻量级、独立的人工智能应用的开发,同时减少对云计算资源的依赖。由于这些模型可以在智能手机等小型设备上运行,预计它们将在移动应用领域产生积极的影响。
随着OpenELM大模型的发布,苹果进一步展示了其在人工智能领域的创新能力。通过提供一系列不同参数大小的模型,苹果为开发者和用户提供了更多选择,帮助他们在各种设备上使用人工智能技术。