华为昇腾MindIE+Dify本地私有化部署大模型 经验分享
本教程适用完全无网络的封闭环境部署
本文旨在分享使用华为昇腾MindIE(Mind Inference Engine,昇腾推理引擎)结合Dify(大模型应用开发平台)成功部署通义千问和deepseek等大语言模型,并上线问答助手等应用的经验,同时也是对自己前段时间的工作进行一个总结。
我会分享我在项目过程中踩过的坑,遇到的bug,以及实测解决的方法。目前计划分为6篇文章,系列文章持续更新中。
本篇文章是系列文章的目录,也是我在项目过程中自行搜罗到的实用资源分享,包括了镜像下载链接、模型下载链接,以及华为昇腾官方的模型部署教程。
大模型本地私有化部署系列文章目录
实用资源分享
昇腾镜像仓库:https://www.hiascend.com/developer/ascendhub
昇腾ModelZoo模型库:https://www.hiascend.com/software/modelzoo/models
部署LLM需要推理镜像,名称:mindie,地址:https://www.hiascend.com/developer/ascendhub/detail/af85b724a7e5469ebd7ea13c3439d48f
注意选择适配自己系统架构的版本arm64 / x86_64
部署embedding、rerank模型需要text embedding inference 镜像,名称:mis-tei,地址:https://www.hiascend.com/developer/