基于Intel ARC Graphics本地部署qwen1.8B大模型

最新推荐文章于 2025-03-03 14:56:51 发布

我有一只大萌宝

最新推荐文章于 2025-03-03 14:56:51 发布

阅读量2k

点赞数 39

分类专栏： pytorch python LLM 文章标签： python conda pytorch

本文链接：https://blog.csdn.net/weixin_47345748/article/details/144266411

版权

基于Intel ARC Graphics本地部署qwen1.8B大模型

背景：

朋友们，前两天在本地搭建好了 xpu 版本的pytorch后，就想在本地部署一个大模型来试试这个Intel arc 这个GPU行不行。于是就有今天这篇踩坑文章，让我们直接开始。

硬件环境：

CPU: Intel Ultra 5 125h

GPU: Intel Arc Graphics

软件环境

Intel® oneAPI Base Toolkit 2024.2 版本（可以参考上一篇环境搭建）

python:3.12.7

anaconda:2024.9.2

pytorch:2.6.0.dev20241119+xpu

一、首先下载我们的模型：

这里我用的是 modelsocpe 来进行下载：

1.1 选择模型

首先去modelsocpe上面搜我们需要的模型

在这里插入图片描述

然后点击模型文件->模型下载这里给我们提供了3种下载方式：SDK 下载、GIT下载、命令行下载

在这里插入图片描述

SDK下载我没有用过，就不讲了

1.2 GIT下载：

确认是否安装 lfs

git lfs install

git clone 下载:

git clone https://www.modelscope.cn/Xenova/Qwen1.5-1.8B-Chat.git

1.3 命令行下载：

安装 modelScope

pip install modelscope

下载完整模型：

modelscope download --model Xenova/Qwen1.5-1.8B-Chat

下载模型到指定的目录：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

我有一只大萌宝

关注关注

39
点赞
踩
41

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

一个python文件带界面离线运行qwen 1.8B 大模型 支持中文附python代码带界面可以CPU运行支持window Ubuntu

三维点云技术探索

02-28

502

【代码】一个python文件带界面离线运行qwen 1.8B 大模型 支持中文附python代码带界面可以CPU运行支持window Ubuntu。

【深度学习】微调通义千问模型：LoRA 方法，微调Qwen1.8B教程，实践

q742971636的博客

02-23

3862

与全参数微调不同，LoRA和Q-LoRA的训练只需存储adapter部分的参数。假如你需要使用LoRA训练后的模型，你需要使用如下方法。在本篇博客中，我们将介绍如何使用 LoRA 方法微调通义千问模型，以适应特定任务或数据。首先，我们将简要介绍准备数据和运行微调所需的步骤，然后详细说明如何执行 LoRA 微调。首先，您需要准备您的训练数据，并将其存储为 JSON 文件。通过以上步骤，您就可以成功运行 LoRA 方法对通义千问模型进行微调了。在开始微调之前，请确保设置好网络代理，以确保能够顺利访问所需资源。

参与评论您还未登录，请先登录后发表或查看评论

基于Intel ARC Graphics部署Qwen2.5-7B-gpt1-Int4 量化版本

weixin_47345748的博客

12-06

2209

基于Intel arc gpu 使用pytorch xpu版本，本地部署qwen2.5 大模型 gptq int4量化版本

本地化部署Chatglm和防踩坑攻略

2401_84495872的博客

07-27

4986

ChatGLM3是智谱AI和清华大学 KEG 实验室联合发布的对话预训练模型。ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示，*ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能ChatGLM3-6B 采用了全新设计的 [Prompt 格式] ，除正常的多轮对话外。

【3050 Ti】也能本地部署Qwen2.5-VL

最新发布

qq_40797962的博客

03-03

3166

本文将详细介绍如何在一台配备NVIDIA GeForce RTX 3050 Ti显卡的设备上部署Qwen2.5-VL。

动手LLM（1）- Qwen

qq_48824303的博客

05-21

2701

但是你会看到安装失败，因为deepspeed是要在Linux安装的，因此，不能使用windows去进行源码部署。首先根据ModelScope的指南下载模型文件，我是使用git去下载的，你们可以使用SDK。到官网直接下载就好了，下载后直接双击打开安装包，一直next就好了，改一下安装路径。下载的时候很慢，特别是到1.8G的文件的时候就像在没下载一样，这个时候就需要等。下载模型有两种方式，一种是使用git下载，开魔法会快很多。然后就是下载模型，我这里是7B的模型，也可以下载其他的。

Qwen大模型实践之初体验

lldhsds的专栏

05-08

3370

模型下载有两种方式，一种是直接运行大模型demo程序，模型会自动下载，该种方式默认会从huggingface进行下载，国内网络无法直接下载或者速度较慢；demo程序有多个可以进行测试，一种是官方readme文件中给出的实例程序，直接运行，prompt直接写在程序中，打印大模型的回复内容，这种方式没有交互方式；除了可以进行交互外，另外就是运行demo程序后，模型文件会一直加载到GPU中，不用每次推理都进行重复加载，直到停止程序为止。执行，实际体验推理过程较慢，24GB的A100显存资源基本满载。

llamaindex+Internlm2 RAG实践

Denis1999的博客

08-26

723

正常情况下，其会自动从互联网上下载，但可能由于网络原因会导致下载中断，此处我们可以从国内仓库镜像地址下载相关资源，保存到服务器上。指定版本：pip install llama-index-embeddings-huggingface==0.2.2 llama-index-embeddings-instructor==0.1.3。参考别人的操作可以发现模型推理大概需要8.5G的内存，这略微超出我可用内存，我推理时显示使用的内存越7.5G。出故障，长时间无反馈，ctrl+C无法中断程序，直接重启重新运行。

通义千问Qwen 1.8B以及7B chat模型本地化部署

weixin_42118737的博客

05-14

4478

本文简单的记录了在本地部署阿里通义千问1.8B以及7B模型

大模型部署-基于TensorRT-LLM部署Qwen1.5大语言模型-附项目源码+流程教程-优质项目实战.zip

10-15

这将极大地降低大模型部署的门槛，让更多开发者能够参与到这一前沿技术的实践中来。本项目不仅为想要深入了解大模型部署的技术人员提供了一条明确的实践路径，也为整个行业提供了一个高质量的参考案例。通过本项目...

阿里通义千问：本地部署Qwen1.5开源大模型

m0_37559973的博客

06-06

7386

通义千问为阿里云研发的大语言系列模型。千问模型基于Transformer架构，在超大规模的预训练数据上进行训练得到。预训练数据类型多样，覆盖广泛，包括大量网络文本、专业书籍、代码等。同时，在预训练模型的基础之上，使用对齐机制打造了模型的chat版本。

在Jetson设备部署通义千问1.8B大模型

桑榆肖物

12-13

5336

本文主要介绍了如何在 Jetson 设备上使用纯C/C++实现LLaMA模型的推理，而无需安装Python等其他外部依赖。通过本文你将了解如何借助 llama.cpp 项目在NVIDIA的Jetson系列设备上部署大模型，以及如何使用Qwen-1.8B模型进行通用问答任务。

【大模型】微调Qwen1.8B

Dong_ZH的博客

02-21

3240

使用地址数据微调Qwen1.8B。Qwen提供了预构建的Docker镜像，在使用时获取镜像只需安装驱动、下载模型文件即可启动Demo、部署OpenAI API以及进行微调。获取方式：docker pull qwenllm/qwen:cu117。

[大模型]Qwen-1_8B-chat CPU 部署

FL1623863129的博客

04-18

1638

本文介绍了在 Intel 设备上部署 Qwen 1.8B 模型的过程，你需要至少16GB内存的机器来完成这项任务，我们将使用英特尔的大模型推理库来实现完整过程。Bigdl-llm 是一个在英特尔设备上运行 LLM（大语言模型）的加速库，通过 INT4/FP4/INT8/FP8 精度量化和架构针对性优化以实现大模型在英特尔 CPU、GPU上的低资源占用与高速推理能力（适用于任何 PyTorch 模型）。

LLM系列 | 26：阿里千问Qwen模型解读、本地部署

热门推荐

ljp1919的专栏

11-04

2万+

Qwen 是一个全能的语言模型系列，包含各种参数量的模型，如 Qwen（基础预训练语言模型，即基座模型）和 Qwen-Chat（聊天模型，该模型采用人类对齐技术进行微调）。基座模型在众多下游任务中始终表现出卓越的性能，而聊天模型，尤其是使用人类反馈强化学习（RLHF）训练的模型，具有很强的竞争力。聊天模型Qwen-Chat拥有先进的工具使用和规划能力，可用于创建agent应用程序。即使在使用代码解释器等复杂任务上，Qwen-Chat与更大的模型相比也能表现出极具竞争力的性能。

阿里Qwen-1.8B的介绍和下载部署详细步骤

雨落

03-01

1624

如果硬件资源有限（如消费级 GPU 或纯 CPU），Qwen-1.8B 是一个非常好的选择。如果需要一个中等规模模型来完成简单任务（如问答、文本生成），Qwen-1.8B 能够满足需求。（1）优点总结轻量化设计：参数量适中，硬件需求适中。高效性：推理速度快，适合实时性任务。中文优化：在中文任务上表现优异。（2）缺点总结性能有限：在复杂任务上的表现可能不如大规模模型。生态有限：与国际模型相比，工具链和社区生态仍在发展中。

Ubuntu 安装Qwen/FastGPT

杨江的IT分享专栏

03-24

3139

注册一个账号进去作者：小杨生存日记 https://www.bilibili.com/read/cv32462618/ 出处：bilibili。docker logs m3e 提示 POST /v1/chat/completions HTTP/1.1" 404 Not Found。_id: "rs0", // 这应与配置文件中的replSetName相同。_id: "rs0", // 这应与配置文件中的replSetName相同。下面的指令，可以ssh退出后，ollama还在运行。

英特尔推出oneAPI 2023工具包，大幅提升即将推出的英特尔硬件的价值

英特尔开发人员专区

01-09

1193

英特尔oneAPI 2023工具包包括一套完整的最新编译器、库、分析和移植工具，以及优化后的AI和机器学习框架，让开发者能为oneAPI支持的CPU、GPU和FPGA构建高性能、跨架构的应用。开发者可使用这些工具快速实现性能目标，并通过单个代码库节省时间，从而将更多时间用于创新.

爬虫python学习

07-28

爬虫Python学习是指学习如何使用Python编程语言来进行网络爬取和数据提取的过程。Python是一种简单易学且功能强大的编程语言，因此被广泛用于爬虫开发。爬虫是指通过编写程序自动抓取网页上的信息，可以用于数据采集、数据分析、网站监测等多个领域。对于想要学习爬虫的新手来说，Python是一个很好的入门语言。Python的语法简洁易懂，而且有丰富的第三方库和工具，如BeautifulSoup、Scrapy等，可以帮助开发者更轻松地进行网页解析和数据提取。此外，Python还有很多优秀的教程和学习资源可供选择，可以帮助新手快速入门并掌握爬虫技能。如果你对Python编程有一定的基础，那么学习爬虫并不难。你可以通过观看教学视频、阅读教程、参与在线课程等方式来学习。网络上有很多免费和付费的学习资源可供选择，你可以根据自己的需求和学习风格选择适合自己的学习材料。总之，学习爬虫Python需要一定的编程基础，但并不难。通过选择合适的学习资源和不断实践，你可以逐步掌握爬虫的技能，并在实际项目中应用它们。 #### 引用[.reference_title] - *1* *3* [如何自学Python爬虫？零基础入门教程](https://blog.csdn.net/zihong523/article/details/122001612)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [新手小白必看 Python爬虫学习路线全面指导](https://blog.csdn.net/weixin_67991858/article/details/128370135)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]