使用MLX在本地运行大型语言模型：详细教程与实践

最新推荐文章于 2025-03-27 15:26:14 发布

qq_37836323

最新推荐文章于 2025-03-27 15:26:14 发布

阅读量1.3k

点赞数 15

文章标签：语言模型人工智能自然语言处理 python

本文链接：https://blog.csdn.net/qq_29929123/article/details/141731768

版权

使用MLX在本地运行大型语言模型：详细教程与实践

1. 引言

随着人工智能技术的快速发展，大型语言模型（LLM）已成为自然语言处理领域的重要工具。然而，运行这些模型通常需要强大的计算资源和稳定的网络连接。本文将介绍如何使用MLX框架在本地运行大型语言模型，让开发者能够更灵活地使用这些强大的AI工具。

MLX是一个由Apple开发的机器学习框架，专为Apple Silicon芯片优化。它允许开发者在本地设备上高效运行各种机器学习模型，包括大型语言模型。本文将深入探讨如何使用MLX和LangChain库来设置和运行这些模型。

2. 环境准备

在开始之前，我们需要安装必要的Python包。运行以下命令来安装所需的库：

pip install --upgrade mlx-lm transformers huggingface_hub langchain

3. 加载MLX模型

MLX社区在Hugging Face Model Hub上提供了超过150个开源模型。我们可以通过MLXPipeline类来加载这些模型。以下是加载模型的两种方法：

方法1：使用模型ID

from langchain_community.llms.mlx_pipeline import MLXPipeline

pipe = MLXPipeline.from_model_id(
    "mlx-community/quantized-gemma-2b-it",
    pipeline_kwargs={
   "max_tokens": 10, "temp": <

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

qq_37836323

关注关注

15
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

苹果大模型系列之使用 Apple 的 MLX 框架在 Apple Silicon 上运行大型语言模型 (Llama 3)，使用 Apple Silicon (M1、M2、M3、M4) 上的 Appl

iCloudEnd的博客

07-08

603

MLX 受到 PyTorch、Jax 和 ArrayFire 的启发，是 Apple Machine Learning Research 专为 Apple 芯片设计的模型训练和服务框架。它支持一系列机器学习任务，包括大规模文本生成、图像生成和语音识别。该框架与 Hugging Face 集成，可实现模型的无缝加载和服务。

苹果大模型系列之Apple MLX 与 Llama.cpp 对比 Hugging Face Candle Rust，实现本地闪电般快速的LLM

iCloudEnd的博客

06-28

805

在 NLP 部署方面，推理速度是一个至关重要的因素，特别是对于支持 LLM 的应用程序而言。随着 Apple M1 芯片等移动架构数量的不断增长，评估 LLM 在这些平台上的性能至关重要。在本文中，我比较了三个流行的 LLM 库（MLX、Llama.cpp和Hugging Face 的Candle Rust）在Apple M1 芯片上的推理/生成速度。旨在方便开发人员选择最合适的库在本地机器上部署 LLM，同时考虑性能、实现的便利性以及与可用工具和框架的兼容性。

参与评论您还未登录，请先登录后发表或查看评论

使用MLXLLM构建智能聊天代理：从入门到精通

jaioyfpo的博客

11-17

366

通过这篇文章，您学习了如何利用MLX LLM构建强大的聊天代理模型。MLX提供了丰富的工具支持，适合多种应用场景。MLX官方文档LangChain在LLMs中的应用。

专为Apple Silicon优化的开源机器学习框架：MLX （Machine Learning eXtension）

skywalk8163的专栏

02-15

742

MLX能够充分利用Apple Silicon芯片的高性能和能效比，提供更快的训练和推理速度。比如在安装exo的时候，可能就需要安装mlx库。使用M系列芯片（Apple Silicon），原生支持Python >= 3.9，macOS >= 13.5。但是如果mac是Intel芯片，好像就没法装了。会输出arm或者i386。也可以使用uname查询。

mlx-engine：为LM Studio量身打造的Apple MLX LLM引擎

最新发布

gitblog_01114的博客

03-27

316

mlx-engine：为LM Studio量身打造的Apple MLX LLM引擎 mlx-engine ???????? Apple MLX engine for LM Studio 项目地址: https://gitcode.com/gh...

本地运行MLX模型：轻松实现模型推理

dfvcbipanjr的博客

10-02

552

通过本文介绍的步骤，我们可以方便地在本地运行MLX模型。LangChain文档。

node-mlx 机器学习框架使用教程

gitblog_00891的博客

09-13

978

node-mlx 机器学习框架使用教程 node-mlx Machine learning framework for Node.js. 项目地址: https://gitcode.com/gh_mirrors/no/node-m...

使用MLX在Python中实现高效的大语言模型推理

ppoojjj的博客

08-29

1123

MLX是一个用于机器学习的开源框架，专为Apple Silicon设计。它提供了一套高性能的数组操作和神经网络层，可以充分利用Apple芯片的性能优势。针对Apple Silicon优化的性能支持自动微分动态图计算Python和C++ API本文介绍了如何使用MLX框架在Python中实现高效的LLM推理。我们讨论了MLXPipeline的使用、ChatMLX类的应用，以及如何构建一个简单的问答代理。MLX的高效性使得在本地设备上运行大型语言模型成为可能，为开发者提供了更多的应用场景和可能性。

使用MLX Local Pipelines运行本地模型：技术指南与实例

GEAWfaacc的博客

01-07

656

MLX Community是一个开放的机器学习模型社区，托管在Hugging Face Model Hub上，拥有超过150个公开可用的模型。通过MLXPipeline类，我们可以在本地环境中加载和执行这些模型，也可以通过LangChain调用它们的推理端点。

使用 Ollama（Windows 和 Mac）+ 终端/UI 集成在本地运行 DeepSeek R1

iCloudEnd的博客

02-01

256

Ollama是一种工具，可让您在本地机器上运行大型语言模型 (LLM)，而无需云依赖。✔️为什么使用 Ollama？易于安装和模型管理离线工作（下载模型后）支持多种AI模型（DeepSeek，LLaMA，Mistral等）

DeepSeek-R1 背后的数学强化学习如何教会大型语言模型推理

iCloudEnd的博客

02-01

375

在本文中，我们将深入探讨 DeepSeek-R1 的数学和方法核心。我们将介绍他们采用的强化学习技术，并探索导致这些令人印象深刻的结果的创新。

MLX：苹果专为统一内存架构（UMA）设计的机器学习框架

Gloamirror的博客

12-16

1218

熟悉的API：MLX具有与NumPy非常相似的Python API。MLX拥有像mlx.nn和mlx.optimizers这样的高级包，其API紧密跟随PyTorch，以简化构建更复杂的模型。MLX中的数组存在于共享内存中。统一内存架构得益于 CPU 与 GPU 内存的共享，同时与 MacOS 和 M 芯片交相辉映，在效率上，实现对其他框架的降维打击。动态图构建：MLX中的计算图是动态构建的。MLX是苹果硅片上机器学习的数组框架，由苹果机器学习研究团队带来。延迟计算：MLX中的计算是延迟的。

【一】Mac 本地部署大模型

04-02

962

如果上述安装不成功，可以参照这个 git 进行安装。

实现本地化MLX管道：轻松调用开源AI模型

adfyvatbia的博客

12-08

398

MLX是一个开源的机器学习模型库，社区成员在Hugging Face Model Hub上托管了超过150个模型。这些模型广泛应用于自然语言处理、计算机视觉等领域，并可以通过LangChain库方便地在本地或远程调用。通过本地化运行MLX模型，开发者可以更灵活地进行模型训练和推理。MLX丰富的社区资源和开源模型为我们提供了无尽的可能性。LangChain官方文档。

再见llama.cpp和ollama，mlx-community 开源 Llama-3.3-70B-Instruct-4bit

weixin_41446370的博客

12-12

1470

使用 MLX-LM 生成文本，使用 MLX-LM 为 GGUF 格式的模型生成文本；使用 LLaMA 生成大规模文本；使用 LoRA 进行微调；使用 Stable Diffusion 生成图像；使用 OpenAI 的 Whisper 进行语音识别。

苹果深度学习框架`MLX`简介及编译示例

胡争辉

12-16

2345

MLX北京时间2023年12月6日，苹果机器学习研究中心 (Apple machine learning research) 在GitHub上开源MLX。项目地址为。MLX深度学习框架是苹果专门为芯片优化，号称能够简化MaciPadiPhone平台研究人员设计和部署模型的过程。MLX熟悉的 APIMLX具有紧密类似NumPy的Python API。MLX还拥有功能齐全的C++ API，它与Python API非常相似。MLX具有像mlx.nn和这样的更高级别的软件包，其API紧密类似PyTorch。

使用 Apple MLX 对 LLM 进行医学诊断预测微调（教程含完整源码）

iCloudEnd的博客

11-11

329

在我之前的文章中，我讨论了微调大型语言模型 (LLM) 的基础知识及其使用该Apple MLX框架的具体用例，包括如何构建 LLM 的自定义版本。那篇文章重点介绍了使用微调 LLM 的特定用例，mistralai/Mistral-7B-Instruct-v0.2用于Low Rank Adapters (LoRA)文本到 SQL 任务，允许模型根据用户提示生成 SQL 查询。在这篇文章中，我将探讨用于医疗诊断预测的更高级 LLM 微调用例。

mac好用的大型语言模型输出优化框架“Chat with MLX”

m0_61924173的博客

06-27

769

适用于需要高创意和自然语言流畅性的场景。对于生成长文或文章，可以设置更高的值，如 500 到 1000 个 tokens，但需要注意计算资源的消耗。Temperature：较高的 Temperature 值（如 0.7 至 1.0）可以生成更丰富和多样的文本内容，适合用于故事创作、对话生成等。点击upload上传好文档或者youtube视频地址之后在下方的No.Retrieval Docs是检索文档的数量或参数，可以控制用于生成答案或摘要的文档数量也可以控制每次检索返回的文档数量，以便进行模型评估和比较。