自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 资源 (3)
  • 收藏
  • 关注

原创 华为昇腾AI服务器部署Triton Inference Server,运行yolov8s目标检测服务化推理

本文详细介绍了在华为昇腾800IA2硬件环境上部署Triton Inference Server的完整流程。通过目标检测小模型的实践案例,验证了部署方案的可行性,实现了服务化推理功能。主要内容包括:昇腾CANN软件栈与Triton Server的兼容性配置、针对昇腾硬件的模型转换(使用ATC工具将ONNX模型转换为OM格式)、基于Triton的推理服务部署(含模型配置、Python推理脚本编写和服务启动)。实验结果表明,该方案能成功在昇腾AI加速卡上运行推理服务。

2025-10-30 00:52:38 1708

原创 华为昇腾Atlas800IA2安装GPUStack(国产化生态舔砖加瓦)

自GPUStack更新到了V0.6版本后,已经开始支持昇腾硬件了,为国内的硬件生态做了适配,本文介绍如何在昇腾Atlas800IA2使用GPUStack,并部署大模型。

2025-04-28 14:30:42 3001

原创 昇腾910A LoRA微调QwQ-32B模型

记录下基于Ascend 910 对 QwQ - 32B 模型进行LoRA微调,此次微调使用了一台裸金属服务器,服务器配置为 8 卡910A,每卡显存为 32GB。在微调使用的是 llama - factory 套件。

2025-04-22 12:50:06 2443 6

原创 DeepSeek R1 && Ascend全国产化大模型推理本地化部署教程它来了

DeepSeek-R1在昇腾Atlas300IPro使用mindie推理套件本地化部署大模型推理。全栈国产化技术体系

2025-02-05 21:42:03 9483 20

原创 c++确定auto类型变量的类型

auto类型名的确定

2025-01-13 14:48:09 323

原创 AscendCL对tensor维度变换

使用昇腾AscencCL做tensor的维度变换

2025-01-13 09:20:50 365

原创 华为昇腾服务器+Atlas300IPro*2 部署Dify+MindIE+Embedding+Rerank实现Qwen2.5-7B全国产化的大模型推理平台

华为昇腾服务器+Atlas300IPro*2 部署Dify+MindIE+Embedding+Rerank实现Qwen2.5-7B全国产化的大模型推理平台。

2024-09-20 17:21:32 15801 43

原创 昇腾大模型推理解决方案MindIE部署

昇腾大模型推理解决方案MindIE部署笔记,并且分享给大家

2024-09-20 16:47:09 15502 24

原创 昇腾服务器(Atlas800系列)部署embedding和rerank模型

昇腾推理服务器部署embedding和rerank相关的RAG模型

2024-09-14 12:05:21 8804 19

原创 昇腾MindIE大模型推理套件运行出错及解决方式(出问题后记录,陆续更新)

MindIE大模型推理套件问题记录

2024-09-13 15:11:00 2459

原创 香橙派AIPro开发板安装PyQt5 aarch64

ubuntu 22.04 aarch64安装编译安装PyQt5

2024-08-23 10:51:16 1375 1

原创 记录Atlas800服务器环境安装

Atlas800服务器安装部署

2024-07-03 22:16:40 821

原创 stable-diffusion-webui出现NansException: A tensor with all NaNs was produced in Unet

sd-webui运行出现,NansException: A tensor with all NaNs was produced in Unet问题解决方法

2024-05-21 23:03:02 6834 5

原创 昇腾推理卡Atlas300IDuo跑sd-webui

昇腾Atlas300IDuo跑sd-webui

2024-05-17 11:06:29 2946

原创 使用PySide2的Widget写的轮播图插件

基于PySide2的轮播图实现

2024-05-16 21:49:10 433

原创 批量下载huggingface的仓库全部权重文件

批量下载huggingface模型文件

2024-05-15 13:02:05 848

原创 Ascend910A Lora微调Qwen1.5 7B 报错Cast failed, original value: 0.0883883, type: FP32Imm 解决方法

910a微调Qwen1.5 报错Cast failed, original value: 0.0883883, type: FP32Imm解决方式

2024-05-11 11:35:56 733

原创 图像领域数据集相互转换之VOC格式数据集转COCO&yolo样例代码

图像检测数据集转换

2024-04-08 10:53:22 371

原创 安装秋葉aaaki大佬的Stable-Diffusion-WebUI(一)

stable diffusion webui在windows上安装部署

2024-02-28 14:09:54 3888

原创 SelfAttention|自注意力机制ms简单实现

自注意力机制简单实现

2024-02-15 00:25:10 682

原创 Python进程池multiprocessing.Pool

Python的多进程样例开发

2024-01-16 16:52:05 1295 1

原创 opencv的SIFT样例(CPP/python)

opencv SIFT匹配算法测试样例

2024-01-15 23:56:30 610

原创 MindSpore 设置昇腾Ascend 910显存的默认大小,单卡可执行多任务处理

MindSpore配置NPU卡默认占用30GB的显存大小,可使用NPU卡进行多任务的运行。

2023-12-12 10:41:08 6032 1

原创 Ubuntu20.04降低linux版本到5.4.0-26-generic

Ubuntu20.04降低linux版本到5.4.0-26-generic,】部署Ascend910的驱动和CANN等开发环境

2023-12-11 23:15:52 5867 9

原创 昇腾910安装驱动出错,降低Centos7.6的内核版本

Centos7.6 启动内核修改,解决昇腾910安装驱动错误的问题。

2023-12-10 00:36:53 3251

原创 CANN安装失败,提示./toolkit/scripts/install.sh没有那个文件或目录

CANN安装失败,提示toolkit/scripts/install.sh 没有那个文件和目录。

2023-11-18 14:28:01 1413 3

原创 aarch64服务器编译opencv==3.4.2及python包,测试sift,surf算

OpenCV是一种开源的计算机视觉库,提供了各种功能和算法,方便我们在图像处理和计算机视觉任务中使用,为了能够使用SIFT(尺度不变特征变换)和SURF(加速稳健特征)算法,记录一篇编译OpenCV3.4.2的内容

2023-11-18 09:12:48 711

原创 baichuan2的13B Lora微调

全量模型下载地址:https://ascend-repo-modelzoo.obs.cn-east-2.myhuaweicloud.com/MindFormers/baichuan2/Baichuan2_13B_Base.ckpt。数据集:https://github.com/baichuan-inc/Baichuan2/blob/main/fine-tune/data/belle_chat_ramdon_10k.json。说明:底层驱动和固件需的版本需要大于等于C84的版本。3、权重文件下载和准备。

2023-11-12 19:47:41 1755 3

原创 基于MindFormers的GLM2 Lora微调

基于MindSpore的GLM2 Lora微调

2023-11-01 09:46:53 1240 4

原创 AICC的BMS裸金属服务器配置分布式环境

昇腾服务器配置单机多卡分布式环境

2023-10-08 16:09:59 711

原创 人工智能计算中心(AICC)OBS对象存储使用指南

人工智能计算中心(以下简称AICC),提供有AI开发环境、AI训练算力服务以及数据存储服务功能(以下简称OBS)。AI开发环境与数据存储是相互隔离的(开发环境的数据除外),其中数据存储统一存放在OBS桶里面中,以下将讲解如何使用OBS桶进行数据存储以及开发环境中如何与OBS桶进行数据交换。

2023-09-11 22:30:05 1140

转载 jupyter notebook:使用argparse包存在的问题及解决

notebook报错,__main__.py: error: unrecognized arguments: -f /home/ma-user/.local/share/jupyter/runtime/kernel-b6ff3d47-1674-4b19-8b92-98e00c05403c.json

2023-09-08 09:55:57 632

原创 图像预处理之PNG与JPG互转

PN、JPG转换脚本

2023-09-05 15:44:26 285

原创 分类数据集拆分成train和val两个子集

分类数据集的拆分

2023-09-05 15:13:01 476

原创 博晶RMS76x8A板子自带4G转热点网络共享配置

如还WiFi还是无法上网,通过串口进入命令终端执行命令:ping www.baidu.com,如果ping通说明4G网络没问题,如果ping不通,请检查卡是否ok。如还是无法解决,请重启后再连接热点试试。点击应用,带配置完成后用手机连接GL_WIFI测试。Ping不超时,说明网络没有问题。

2023-09-02 13:12:12 359

原创 git 本地有多个网站(gitee\github)账号切换问题

git 本地有多个网站(gitee\github)账号切换问题

2022-06-30 17:12:36 1261

原创 Docker部署python开发环境

​Docker部署python开发环境

2022-06-29 16:29:46 1254

转载 Linux终端分屏软件tmux工具基本快捷键

tmux使用工具基本使用快捷键

2022-06-24 10:12:18 4100

原创 AKStrem+ZLMediakit推拉rtmp流

AKStream和ZLMediakit使用rtmp推拉流

2022-06-10 10:32:49 3364

原创 gcc is unable to create an executable file -- 执行./configure 报错解决办法

编译metartc的ffmpeg出错问题记录

2022-06-06 18:06:40 8261

TritonServer Ascne yolov8s的推理样例代码

TritonServer Ascne yolov8s的推理样例代码

2025-10-31

TritonServer Ascend集成环境下载链接

内容概要:本文提供了Triton Server在Ascend平台上的Docker镜像下载地址,具体为tritonserver24.01-py3-ascend.tar版本,适用于基于华为Ascend AI处理器的环境部署。该资源通过指定的HTTPS链接进行获取,便于用户快速搭建AI推理服务环境。若用户在下载过程中遇到问题,可联系提供者寻求帮助。文档内容简洁明了,主要聚焦于资源获取途径和技术支持方式。; 适合人群:从事AI模型部署、具备一定Docker使用经验的研发人员或运维工程师,特别是使用华为Ascend硬件平台的技术人员。; 使用场景及目标:①用于在Ascend平台上快速部署Triton Inference Server;②支持AI推理服务的容器化构建与运行;③帮助开发者离线环境下导入镜像并开展本地调试与集成。; 阅读建议:下载后建议校验镜像完整性,并结合Triton Server官方文档进行配置与启动,确保环境依赖和驱动版本兼容,提升部署效率。

2025-10-31

Linux移植的简单步骤说明

ARM Linux 系统移植和开发的简单流程

2022-05-27

NFS文件服务器的搭建和操作

nfs是网络文件系统,它可以将服务器上的一个文件夹挂载到本机作为一个文件系统。利用这个工具可以直接利用服务器上面的文件,而不用先下载到本地,给调试程序和文件系统带来极大的便利。

2022-07-01

opencv-ippicv

编译opencv 时需要下载的第三方包

2024-06-12

torch-npu-1.11.0.post2-cp39-cp39-linux-aarch64.whl

torch_npu-1.11.0.post2-cp39-cp39-linux_aarch64,运行在Ascend910上的pytorch npu包,适用于CANN6.3.RC2版本

2023-09-14

apex-0.1-ascend-cp39-cp39-linux-aarch64.whl

Ascend apex-0.1_ascend-cp39-cp39-linux_aarch64,适用于CANN的版本为6.3.RC2

2023-09-14

金手指铜片的质检分类数据集

内存条金手指的分类数据集,分成两个类别,一个是ng,一个是ok,同时分有训练和测试两个数据集。因为模型的需要,原来的铜片大小在200*60左右的像素,我把它填充到256*256大小的画布中,铜片放在中间。使用resnet分类,效果不太好,但是使用vit进行分类,准确率达到0.9914。

2023-09-11

博晶RMS7688A iot开发板固件

基于博晶提供的sdk编译出定制化的sdk固件包,当然你也可以它编译一个定制化的SDK固件包,以满足特定需求。这个定制化的SDK固件包可以被视为基本的SDK包的扩展。它包含了博晶SDK的功能,并针对您的需求进行了优化和定制。通过使用这个定制化的SDK固件包,您可以更高效地开发并集成。

2023-09-02

MySQL数据库主从同步服务器部署

MySQL数据库主从同步服务器部署说明文档

2022-03-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除