Mindie在华为910B推理大模型

最新推荐文章于 2025-04-09 22:59:39 发布

七月花nancy

最新推荐文章于 2025-04-09 22:59:39 发布

阅读量1.7k

点赞数 4

文章标签： python fastapi

本文链接：https://blog.csdn.net/weixin_41549308/article/details/140936009

版权

Mindie在华为910B推理大模型 - 掘金 (juejin.cn)

之前在华为昇腾服务器上推理了Qwen1.5-14b-chat模型，但是用Mindie RC1.0版本无法兼容openai接口，传递的文本字符数有限，不能超过16000.因此，选用了最新版本的Mindie RC2.0版本，成功推理。步骤和上述链接一致，但是下载镜像的时候用MindieRC2.0.

---------------------------------------------------------------------------------------------------------------------------------

目前利用Mindie启动了大模型服务，fastchat启动了embedding服务，然后再启动langchain-chatchat就成功运行，且推理速度和V100卡差不多。

如果大家有部署问题，可以后台私信我~

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

七月花nancy

关注关注

4
点赞
踩
1

收藏

觉得还不错? 一键收藏
13
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
打赏
打赏
打赏举报

举报

大模型国产化适配9-LLM推理框架MindIE-Service性能基准测试

强化学习曾小健

08-03

2243

本文简要介绍了LLM推理过程、LLM推理服务的目标、常见的LLM服务评估指标以及LLM推理优化技术。同时，使用MindIE-Service对不同的大模型的推理延迟和吞吐量进行了测试。参考文档：Reproducible Performance Metrics for LLM inference / 可复现的语言大模型推理性能指标LLM 推理性能工程最佳实践大语言模型推理性能工程优化最佳实践吃果冻不吐果冻皮专注于AI工程化（LLM、MLOps、LLMOps、RAG、Agent）落地。150篇原创内容。

昇腾910B国产化大模型适配指南

热门推荐

qq_42751565的博客

06-01

1万+

华为910B国产化大模型训练环境安装指南，支持Huggingface模型以及DDP分布式训练框架。

13 条评论您还未登录，请先登录后发表或查看评论

在BigCloud系统使用昇腾910bGPU与MindIE镜像部署DeepSeek模型指南

一起加油吧

04-09

1288

本文介绍如何基于华为BigCloud操作系统，利用昇腾（Ascend）GPU硬件加速能力，通过华为云MindIE（MindSpore Inference Engine）Docker镜像快速部署DeepSeek大语言模型。/usr/local/Ascend/mindie/2.0.T3/mindie-service/2.执行命令，启动服务。覆盖安装或升级请按照“固件->驱动”的顺序。在安装驱动固件前，需要安装前确认操作系统，并检查环境。若系统出现如下关键回显信息，则表示驱动安装成功。参考文档进行接口调用。

华为910b推理Qwen1.5-72b

weixin_41549308的博客

07-12

3917

910b部署推理大模型

昇腾大模型推理解决方案MindIE部署

深蓝

09-20

1万+

昇腾大模型推理解决方案MindIE部署笔记，并且分享给大家

在华为昇腾 910B 上进行阿里大模型 Qwen2.5 推理

2301_78285120的博客

11-03

4656

异构 GPU 支持：支持异构 GPU 资源，当前支持 Nvidia、Apple Metal、华为昇腾和摩尔线程等各种类型的 GPU/NPU多推理后端支持：支持vLLM和推理后端，兼顾生产性能需求与多平台兼容性需求多平台支持：支持 Linux、Windows 和 macOS 平台，覆盖 amd64 和 arm64 架构多模型类型支持：支持 LLM 文本模型、VLM 多模态模型、Embedding 文本嵌入模型和 Reranker 重排序模型等各种类型的模型多模型仓库支持。

基于华为昇腾910B，实战InternVL2-8B模型推理

OpenGVLab的博客

10-31

2755

在 0.6.0这个版本上开始支持华为昇腾NPU，本文主要讲述了如何使用 LMDeploy 推理框架在华为昇腾 910B 上实现 InternVL2-8B 模型的推理。LMDeploy 目前支持 InternVL1.5 和 InternVL2 系列的多模态模型，因为时间关系我这里只做了 2B 和 8B 模型的推理，其他模型没有做过测试。感兴趣的小伙伴也可以根据文档实现其它模型的推理和适配，我们也期待 LMDeploy推理框架支持更多更好用的多模态大模型。

华为昇腾910B编程实战：大模型推理性能优化全攻略

水务人

03-29

1079

华为昇腾910B编程实战：大模型推理性能优化全攻略

华为MindIE初体验：Qwen1.5-14B-Chat模型40并发推理实测

强化学习曾小健

08-03

3940

原创 XC272024年07月03日 22:14北京最近发现华为NPU的生态里多了一个成员——MindIE，部分解决了大模型推理的问题，下面简要介绍下Mind华为昇腾NPU卡的生态。

华为MindIE LLM开发指南-大型语言模型优化及其应用详解

03-20

内容概要：文章《MindIE 1.0.RC3 LLM开发指南 01.pdf》是关于华为发布的针对大型语言模型(MindIE)的开发指南。此文档涵盖从安装配置环境、模型量化到实际应用场景的一系列步骤，并深入介绍了各种优化措施和技术创新...

华为昇腾MindIE+Dify本地私有化部署大模型 经验分享

Yingjie_Zhang666的博客

02-14

4284

本文旨在分享使用华为昇腾MindIE（Mind Inference Engine，昇腾推理引擎）结合Dify（大模型应用开发平台）成功部署通义千问和deepseek等大语言模型，并上线问答助手等应用的经验，同时也是对自己前段时间的工作进行一个总结。我会分享我在项目过程中踩过的坑，遇到的bug，以及实测解决的方法。目前计划分为6篇文章，系列文章持续更新中。本篇文章是系列文章的目录，也是我在项目过程中自行搜罗到的实用资源分享，包括了镜像下载链接、模型下载链接，以及华为昇腾官方的模型部署教程。

【大语言模型_2】mindie部署deepseek模型

没枕头我咋睡觉

02-19

1508

进入容器，修改配置文件。不修改启动模型会报错。

华为裸金属昇腾Atlas 900A2 P0D(910B)部署Deepseek蒸馏70b LLaMA模型

Lilk5的博客

03-12

2279

注：因为openui需要跟本地的模型通信，本地模型docker网络通信采用的是host模式，openui也要采用此方式，然后做持久化挂载，使用docker-compose up -d启动即可，默认的端口是8080。模型可视化对话用的最多的就是openweb-ui，参考了大部门的教程都是使用python3.11安装的，用3.11会破坏现有的环境，会冲突，所以就使用了docker-compose的方式。下载方式有很多，个人比较推荐git lfs，比较简单一些，最终的目的是把模型下载下来就可以。

国产算力怎么跑大模型？教你在昇腾 910B 上部署 DeepSeek

最新发布

努力分享一些人工智能相关的知识干货！

04-09

1263

本篇文章从工程实战出发，带你完成在 **昇腾 910B 芯片**上部署 DeepSeek 大模型的全流程，包括： - ✅ 从 HuggingFace 格式模型出发，转换为 MindIR 可推理格式 - ✅ 使用 MindSpore 框架加载模型并构建推理循环 - ✅ 封装 FastAPI 接口，实现私有化部署服务化调用 - ✅ 全面调优显存 / 吞吐 / 精度，并规避常见报错与兼容性问题文章内容完整、结构清晰、可直接落地，**真正解决“没有 A100 也能跑”的问题**。

mindie推理大语言模型问题及解决方法汇总

yuanlulu的博客

12-23

2508

Ollama：一个在本地部署、运行大型语言模型的工具

积跬步，至千里。

05-25

5538

Ollama是一个开源项目，它专为在本地机器上能便捷部署、以及运行大型语言模型（LLM）而设计的工具。

华为昇腾服务器+Atlas300IPro*2 部署Dify+MindIE+Embedding+Rerank实现Qwen2.5-7B全国产化的大模型推理平台

深蓝

09-20

1万+

华为昇腾服务器+Atlas300IPro*2 部署Dify+MindIE+Embedding+Rerank实现Qwen2.5-7B全国产化的大模型推理平台。

国产化推理引擎实现通义千问推理加速

qq_36344652的博客

07-30

1466

根据MindIE实现Qwen推理加速的部署经验，分享给需要的人

在升腾910b部署qwen2

01-10

为了成功在华为升腾910B AI处理器上部署Qwen-2大模型，需确保硬件配置满足需求并安装适当版本的软件包。具体来说： - **硬件**：Ascend 910B 处理器。 - **软件环境**： - 驱动版本：24.1.rc1 - CANN 版本：8.0....