IPEX-LLM: 英特尔硬件大语言模型加速库部署

最新推荐文章于 2025-06-05 09:09:22 发布

原创

最新推荐文章于 2025-06-05 09:09:22 发布 · 4.6k 阅读

CC 4.0 BY-SA版权

文章标签：

大语言模型的本地部署正成为一个热门话题。本指南将帮助你掌握如何使用 IPEX-LLM（Intel PyTorch Extension for Large Language Models）在英特尔硬件上实现最优化的模型部署。无论你是刚开始接触还是已经有一定经验，这份指南都能满足你的需求。

IPEX-LLM 是英特尔基于 PyTorch 开发的专业优化库，它不仅能显著提升 CPU 推理性能，还为英特尔全系列 GPU 提供了深度优化支持。它支持以下硬件平台：

覆盖主流开源模型生态：

完美对接主流框架：

处理器选择：

显卡支持：

📝 重要说明

IPEX-LLM 主要面向 Linux 平台，Windows 用户可通过 WSL 使用

iGPU 用户需要自行配置环境

Arc 系列 dGPU 用户推荐使用 Windows + WSL + Docker 方案

# 创建并激活 conda 环境
conda create -n llm python=3.11 libuv
conda activate llm

根据处理器型号选择安装命令：

Intel Core™ Ultra 处理器（Series 2，型号 2xxV，代号 Lunar Lake）：

美国地区：

pip install --pre --upgrade ipex-llm[xpu_lnl] --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/lnl/us/

中国地区：

pip install --pre --upgrade ipex-llm[xpu_lnl] --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/lnl/cn/

其他 Intel iGPU 和 dGPU：

美国地区：

pip install --pre --upgrade ipex-llm[xpu] --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/xpu/us/

中国地区：

pip install --pre --upgrade ipex-llm[xpu] --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/xpu/cn/

在 Miniforge Prompt 中设置环境变量：

Intel iGPU：

set SYCL_CACHE_PERSISTENT=1
set BIGDL_LLM_XMX_DISABLED=1

Intel Arc™ A770：

set SYCL_CACHE_PERSISTENT=1

import torch 
from ipex_llm.transformers import AutoModel, AutoModelForCausalLM    
tensor_1 = torch.randn(1, 1, 40,