自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(47)
  • 收藏
  • 关注

原创 Atlas 800I A2 + mindie 离线部署 DeepSeek-R1-Distill-Llama-70B 和 Qwen3-32B

除了环境和软件版本不一样,其他操作一样。

2026-01-29 14:22:58 88

原创 Atlas 800I A2 + vllm-ascend 离线部署 Qwen/Qwen3-Embedding-8B 和 Qwen/Qwen3-Reranker-8B

本文介绍了在Atlas800IA2硬件上部署Qwen3-Embedding-8B模型的完整流程。环境配置包括openEuler系统、Ascend驱动和vllm-ascend容器。部署步骤详细说明了容器创建、环境变量配置和服务启动命令,支持通过HTTP接口进行文本嵌入测试。文档还提供了常见问题解答,如输出维度设置可能导致的报错问题。整个部署过程充分利用了华为Ascend硬件加速能力,为大规模语言模型应用提供了高效解决方案。

2026-01-28 21:09:41 112

原创 OMP: Hint This means that multiple copies of the OpenMP runtime have been linked into the program.

摘要:当出现"OMP:Error#15"错误提示时,表明程序重复加载了OpenMP运行时库,可能导致性能下降或结果错误。解决方法是在代码开头设置环境变量KMP_DUPLICATE_LIB_OK为TRUE,允许重复加载。具体操作:导入os模块后添加os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"。注意这只是一个临时解决方案,最佳实践是确保只链接单个OpenMP运行时库。

2025-12-09 14:34:00 182

原创 配置开发环境(windows)

本文介绍了Windows环境下开发环境的配置方法:1)安装Docker Desktop并启用WSL2;2)安装Git和Git LFS;3)安装Miniconda并配置环境变量;4)搭建C/C++开发环境(GCC、CMake、Make、Visual Studio);5)详细说明GPU开发环境配置流程,包括NVIDIA驱动安装、CUDA和cuDNN的安装配置方法,以及PyTorch的GPU版本安装验证步骤。最后提供了常见问题解决方案,如CUDA工具集缺失时的处理方法。

2025-12-01 17:12:04 813

原创 YOLO版本系列的特点

YOLO系列目标检测算法发展综述:从YOLOv1(2016)到YOLOv12(2024),该系列持续优化检测速度和精度。早期版本(v1-v3)通过单次检测框架、多尺度训练等创新实现实时检测;中期(v4-v7)引入CIoU损失、特征融合等技术提升性能;近期版本(v8-v12)注重模块化设计、轻量化(如YOLOv9减少49%参数)及新机制(如注意力机制)。其中YOLOv5/v8/v11由Ultralytics团队开发,强调工程实用性。该系列始终平衡速度与精度,广泛应用于工业检测等领域。

2025-11-29 16:25:11 104

原创 Atlas 300I Duo - vllm部署Qwen3-VL-8B-Instruct

本文介绍了在Ascend NPU环境下部署Qwen3-VL-8B大语言模型的步骤。主要包括:1)安装驱动、docker和vllm镜像;2)创建特权容器并挂载设备与目录;3)进入容器安装指定版本的transformers;4)设置环境变量和NPU卡配置;5)启动vllm服务;6)测试API接口。部署过程涉及多块NPU卡的使用,需注意内存碎片化问题,最终通过vllm框架提供模型推理服务。

2025-11-29 16:20:43 1242 15

原创 鲲鹏适配 - 安装docker、docker-compose、maxkb、openjdk、maven、tomcat、neo4j、python-3.11.0、rasterio、dify

本文详细介绍了在Linux系统上安装多个开发工具和环境的过程:1)安装Docker和Docker-Compose,包括解压、配置服务和设置开机启动;2)部署maxkb知识库系统;3)安装OpenJDK并配置环境变量;4)安装Maven并配置仓库镜像;5)安装Tomcat并设置为系统服务;6)通过容器方式安装Neo4j图数据库;7)编译安装Python 3.11.0;8)部署Dify平台,包括修改端口配置和环境变量。所有步骤均包含详细的命令操作和配置说明,适合在ARM架构服务器上搭建完整的开发环境。

2025-11-29 16:14:38 491

原创 服务器常见问题-FAQ

本文用于服务器硬件故障、bios配置问题排查

2025-11-29 15:56:11 443

原创 关于kubernetes和docker版本的一些总结

摘要:Kubernetes从v1.24开始不再内置支持Docker作为容器运行时,需使用CRI兼容的运行时(如containerd)或额外安装cri-dockerd插件。v1.22版本移除了Docker的cgroup驱动自动检测,v1.20开始弃用Docker。用户需注意Kubernetes版本与Docker版本的兼容性,可通过官方变更日志查询。Docker版本号在2017年从1.x变更为17.x,源于产品线分为CE和EE版本。建议使用推荐版本确保系统稳定性。

2025-09-05 21:44:12 1310

原创 使用mindie:2.0.RC2-800I-A2-py311-openeuler24.03-lts制作一个通用的模型推理性能测试的镜像

本文详细介绍了在NPU环境下进行模型推理性能测试的完整流程。首先配置了测试所需的环境和设备信息,包括Python 3.10.9和3.11.6版本、测试脚本和镜像文件。然后分步骤说明了镜像制作过程:创建特权容器、安装Python 3.10.9、配置VLLM环境,并详细描述了测试容器的启动方法。最后提供了镜像打包和使用指南,包括如何加载镜像、启动容器、运行测试脚本(以DeepSeek-32B模型为例)以及更换测试模型的步骤。整个过程涉及环境变量配置、权限设置和服务启动等关键操作。

2025-07-04 19:37:22 904

原创 什么是AI芯片?

AI芯片是专为人工智能应用设计的集成电路,主要分为CPU、GPU、FPGA和ASIC四种类型。CPU擅长逻辑控制但并行计算能力较弱,GPU具备强大的并行处理能力但功耗较高,FPGA灵活性好但开发门槛高,ASIC针对特定场景优化性能最佳但研发成本高。这些芯片在灵活性、计算效率和能耗方面各有优劣,需根据具体AI任务需求选择合适的芯片架构。

2025-06-03 16:53:08 974

原创 AISBench benchmark评测工具实操-精度评测场景-采用命令行指定模型和数据集的方式

搭建AISBench benchmark测试环境,包括创建conda环境、安装AISBench benchmark、处理ceval数据集,并修改相关配置文件以适配测试需求。最终,通过启动精度测评,验证了模型在指定环境下的性能。

2025-05-14 13:46:51 1845

原创 pip 常用命令及配置

pip 常用命令和配置

2025-05-02 18:49:27 866

原创 掌握 Linux 中 SELinux 的强制访问控制机制和 iptables、 firewalld 两种防火墙以及他们的使用方法

介绍SELinux、iptables、firewalld的原理及常用操作

2025-04-29 11:44:24 272

原创 docker 常用配置

【代码】docker 常用配置。

2025-04-26 16:36:48 204

原创 Linux 下载安装 docker 和 docker-compose

Linux 下载安装 docker 和 docker-compose

2025-04-26 16:20:42 2541

原创 Atlas 800I A2 离线部署 DeepSeek-R1-Distill-Llama-70B

NPU驱动:Ascend-hdk-910b-npu-driver_24.1.rc3_linux-aarch64.run。NPU固件:Ascend-hdk-910b-npu-firmware_7.5.0.1.129.run。MindIE镜像:2.0.T3-800I-A2-py311-openeuler24.03-lts。注意:这里驱动固件最好用商业版,我这里用的社区版有点小问题。2.2、安装驱动(根据提示选择是否重启)2.3、安装固件(根据提示选择是否重启)2.1、创建运行用户和所属组。

2025-04-24 15:34:42 2235 4

原创 Atlas-800I A2 部署ComfyUI + Flux + clip + vae

修改requirements.txt文件,指定torch和numpy版本,添加decorator依赖。# 安装Miniconda3会指定路径,默认是/root/miniconda3。1、验证torch_npu时报缺少hccl.so问题。2、启动ComfyUI时报缺少decorator模块。五、安装torch和torch_npu并验证。2、打包conda环境。二、安装Miniconda3。四、创建comfyenv环境。六、安装ComfyUI依赖。八、打包环境,进行离线部署。七、启动ComfyUI。

2025-04-14 16:17:40 1208

原创 Atlas系列硬件对LLM语言大模型的适配支持程度

Atlas系列硬件对LLM语言大模型的适配支持程度

2025-03-30 12:35:23 1281

原创 Linux设备永久挂载

Linux设备永久挂载

2025-03-26 17:17:31 412

原创 RAG核心概念

RAG核心概念和工作流程

2025-03-25 22:51:33 645

原创 Atlas 800I A2 双机直连部署DeepSeek-R1-w8a8

检测IP配置成对端NPU口的IP,比如说机器1的IP是: 192.168.10.11,机器2的IP是:192.168.10.19。NPU驱动:Ascend-hdk-910b-npu-driver 24.1.0 linux-aarch64.run。NPU固件:Ascend-hdk-910b-npu-firware 7.5.0.3.220.run。MindIE镜像:2.0.T3-800I-A2-py311-openeuler24.03-lts。操作系统:openEuler 22.03 LTS。

2025-03-24 21:37:53 2604

原创 Linux修改SSH端口号

【代码】Linux修改SSH端口号。

2025-03-24 20:44:41 713

原创 昇腾-DeepSeek-FAQ

昇腾-DeepSeek-FAQ

2025-03-24 11:05:28 1411 1

原创 Atlas 800 T A2四机部署满血DeepSeek-R1

NPU驱动:Ascend-hdk-910b-npu-driver 24.1.0 linux-aarch64.run。docker run -itd --privileged --name=容器名称 --net=host \。NPU固件:Ascend-hdk-910b-npu-firware 7.5.0.3.220.run。"managementIpAddress" : "改成主节点IP""modelWeightPath" : "权重路径""ipAddress" : "改成主节点IP"

2025-03-10 02:35:31 2573

原创 Ubuntu-FAQ

apt-key 等实际上并不是直接使用 /etc/apt/apt.conf 配置文件,而是每次执行操作的时候将配置文件复制到临时文件夹下(以做一些修改等)。虽然 apt-get 需要 Root 权限才能执行,但执行过程中的子任务,例如调用 apt-key 时,是交给 _apt 这一用户完成的。所以实际上问题很简单,既是目录对 _apt 用户缺少了权限,因此无法创建临时的 apt.conf 文件。无法创建配置文件 /tmp/apt.conf.KSeTlI 并传递给 apt-key。

2024-06-13 16:59:50 829

原创 Linux逻辑卷管理(LVM)

安装 Linux 操作系统时遇到的⼀个常见的难以决定的问题就是如何正确地评估各分区大小,以分配合适的硬盘空间;基本的磁盘分区管理方式在逻辑分区划分好之后就无法改变其大小。随着 Linux的逻辑卷管理功能的出现,这些问题都迎刃而解,用户在无需停机的情况下可以方便地调整各个分区大小,即动态调整磁盘容量,从而提高磁盘管理的灵活性。

2024-06-09 14:13:51 1315

原创 Linux交换分区管理

提升“内存容量,防止OOM(out of memory,内存溢出)。从功能上讲,交换分区主要是在内存不够用的时候,将部分内存上的数据交换到swap空间上,以便让系统不会因内存不够用而导致OOM或者更致命的情况出现。也就是说,当内存不够用时,我们使用 swap 分区来临时顶替。这种“拆东墙,补西墙”的方式应用于几乎所有的操作系统中。使用swap交换分区,显著的优点是,通过操作系统的调度,应用程序实际可以使用的内存空间将远远超过系统的物理内存。

2024-06-09 12:25:36 790

原创 配置本地 yum 源

【代码】配置本地 yum 源。vim /etc/yum.repos.d/local.repo添加以下内容到local.repo文件:[local] # 仓库的名字name=系统 Local Repository # 仓库描述baseurl=file:///mnt/iso # 仓库地址,file://表示本地仓库enabled=1 # 是否启用该仓库,1:启用,0:不启用gpgcheck=0 # 是否校验软件包的签名,1:校验,0:不校验

2024-06-04 17:27:34 637

原创 配置本地 apt 源

注意:文章中的挂载方法是临时挂载,重启服务器失效我是使用iBMC的虚拟控制台将我的iso文件以设备的形式挂载到服务器上,我的iso文件是设备:/dev/sr0也可以直接将iso文件上传到服务器某个目录。

2024-06-04 13:30:53 7581

原创 离线环境下安装NVIDIA驱动、CUDA(HUAWEI Kunpeng 920 + NVIDIA A100 + Ubuntu 20.04 LTS)

因为国防项目中是离线环境,所以提前收集一下用到的依赖和软件包,同时出一个指导书,方便后续工作。

2024-06-01 16:24:16 5695

原创 Ubuntu 离线安装 apt 依赖包

项目现场的服务器无法连接互联网,需要提前获取 gcc、g++、make 等依赖包。

2024-06-01 16:22:06 6776 6

原创 Linux磁盘管理(基本磁盘管理,不涉及逻辑卷LVM)

首先查看服务器是否将磁盘挂载:lsblk然后进行磁盘分区:fdisk在分好的分区上创建文件系统:mkfs最后将创建好的文件系统挂载到Linux系统上在使用了一段时间后想看看剩余空间:df、du我在下面对磁盘整个使用过程进行了介绍,希望帮到大家。

2024-05-24 14:06:22 1253 2

原创 Linux磁盘介绍

早期计算机使用的磁盘是软磁盘(Floppy Disk,简称软盘),如今常用的磁盘是硬磁盘(Hard disk,简称硬盘)。支持的分区数量: 4个主分区或者3个主分区1个扩展分区(分区表占据64个字节,其中每个分区的信息占用16个字节,分区表里面可以记录四个分区信 息描述):机械硬盘即是传统普通硬盘,主要由:盘片,磁头,盘片转轴及控制电机,磁头控制器,数据转换器,接口,缓存等几个部分组成。标准硬盘规定的2.5寸和3.5寸,指的既不是硬盘的长,也不是硬盘的宽,而是盘体内存储数据的磁盘盘片的直径。

2024-05-23 21:51:03 1071 1

原创 Linux的管道和重定向

我们有时候会将一个命令的输出当作另一个命令的输入或者将文件中的内容当作命令的输入,这时候就会用到重定向和管道。file descriptors,FD,文件描述符,进程使用文件描述符来管理打开的文件。FD是访问文件的标识,即链接文件。省去了冗长的绝对路径;0 是键盘只读1,2 是终端可以理解是屏幕3+ 是文件,可读可写输出重定向分为正确输出和错误输出。

2024-05-23 10:57:01 1497

原创 Linux后台进程管理(作业控制:&、jobs、fg、bg、ctrl + z、nohup)

有时候我们需要将一个进程放到后台去运行,或者将后台程序切换回前台,这时候就用到了我们的作业控制的命令。或者我们希望一个进程在终端退出后还能继续执行,这时候会用到&和nohup命令。1、&在命令后面加&表示放到后台运行2、ctrl + z将一个正在执行的前台进程放到后台,并且暂停3、jobs查看当前后台作业(进程),是获取本次bash下的后台作业。当本次终端退出后,后台作业变成孤儿进程,孤儿进程有系统父进程接管。当再次连接终端时,原作业与当前终端,不存在关系父子关系,故看不到进程。

2024-05-22 19:13:12 937 1

原创 Linux进程管理

本文内容:进程相关概念;工作中常用到的进程管理的命令ps、top、kill;进程优先级的概念及修改优先级的命令。

2024-05-22 17:59:58 1101 1

原创 ubuntu配置静态ip

服务器安装好系统后需要配置静态ip,记录一下配置的方法。1、查看要配置的网卡名称ip a可以看到我的enp189s0f0网卡是 UP 状态2、配置enp189s0f0 网卡的静态 ip配置文件在/etc/netplan/ 目录下,不同的系统配置文件名称可能不同添加如下配置,注意“:”后面有个空格:addresses: [10.255.140.182/16] #ip地址和掩码gateway4: 10.255.1.1 #网关。

2024-05-22 15:23:40 670

原创 ubuntu系统禁止/开启内核自动更新

内核自动更新会导致驱动和内核版本不对应,导致驱动无法使用,所以需要禁止自动更新内核。本文介绍ubuntu系统禁止/开启内核更新的方法。

2024-05-22 14:51:54 5144

原创 ubuntu系统设置可以密码登录并允许root用户登录

本文介绍怎么开启shell通过用户密码连接ubuntu系统,同时开启root用户可以shell远程登录。

2024-05-22 14:04:46 4083

用 Dify 快速构建 AI 应用:部署、配置与实战演示

这份 PPT 是我整理的 Dify 完整学习指南,涵盖 5 大核心模块: 1.Dify 平台深度解析(核心特点 + 应用场景) 2.在线 / 离线部署全流程(含 Docker 配置、镜像处理) 3.关键配置文件详解(环境变量、数据库、Redis 等) 4.核心功能实战演示(大模型集成、应用创建、知识库、变量、工作流) 5.常见问题排查(插件安装、文件限制、容器报错等)

2026-01-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除