zhangxiangweide-CSDN博客

原创创建vllm的docker镜像和容器

本文介绍了使用vLLM部署大模型的完整流程。首先通过Docker启动容器，挂载模型目录并配置GPU资源。接着在容器内安装vLLM，启动服务时需注意模型参数匹配。文章详细说明了部署不同量化模型的方法，包括AWQ量化模型和多模态模型，重点提示了图片输入需base64编码处理。同时解析了关键参数：tensor-parallel-size用于控制GPU数量，max-model-len设置上下文长度，gpu-memory-utilization优化显存利用率。最后解释了服务监控指标含义，帮助用户评估系统性能。整个过程

2025-06-11 19:13:54 315

原创 vllm docker容器部署大语言模型

使用vllm docker容器部署大语言模型。

2025-06-10 11:28:31 563

原创 ubuntu 22.04 换源

参考：清华大学开源软件镜像站ubuntu | 镜像站使用帮助 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror

2025-05-08 16:57:15 780

原创 Docker换源

【代码】Docker换源。

2025-05-08 16:54:54 387

原创 FunASR 在Linux/Unix 平台编译

FunASR 在Linux/Unix 平台编译

2025-01-17 10:29:42 576

原创 ubuntu24.04系统，容器内算法服务运行一段时间cuda突然不能使用

是指执行程序或任务的环境或平台，在不同的上下文中，"运行时" 可能有不同的含义。对于 Docker 和 NVIDIA Container Toolkit 中的运行时，它主要指的是负责管理和执行容器的底层组件。默认情况下，Docker 并不能直接访问 GPU 资源，原因是 GPU 的管理需要专门的驱动程序和工具。运行时，Docker 容器能够更好地与 GPU 进行交互，充分利用硬件资源，满足高性能计算和深度学习训练的需求。运行时，这样它才能正确地与 GPU 驱动进行通信，并将 GPU 资源暴露给容器。

2024-12-20 09:48:37 1268

原创 NVIDIA MPS

当使用MPS时，MPS Server会通过一个 CUDA Context 管理GPU硬件资源，多个MPS Clients会将他们的任务通过MPS Server 传入GPU ，从而越过了硬件时间分片调度的限制，使得他们的CUDA Kernels 实现真正意义上的并行。MPS基于C/S架构，配置成MPS模式的GPU上运行的所有进程，会动态的将其启动的内核发送给MPS server，MPS Server借助CUDA stream，实现多个内核同时启动执行。除此之外，MPS还可配置各个进程对GPU的使用占比。

2024-12-11 16:13:58 1195

原创 Ollama的升级教程

输入"ollama -v"，查看当前ollama版本如果官网下载很快的话，直接下载国内镜像。大家先去看下有没有新版本的，这是魔塔的ollama镜像，如果更新不及时，可以使用我的备份镜像安装modelscope命令行下载。

2024-12-06 11:01:19 8299

原创 Ollama 服务配置-常用环境变量

最新版Ollama开始支持从Huggingface Hub上直接拉取各种模型，包括社区创建的GGUF量化模型。OLLAMA_VERSION环境变量与安装脚本一起使用，以安装特定版本的 Ollama，包括预发行版。可以在 releases 页面中找到版本号。编辑 systemd 服务。这将打开一个编辑器。2. 对于每个环境变量，在。

2024-12-06 09:56:45 22534

原创在Ubuntu系统中将SQL文件导入到MySQL数据库：

ubuntu 安装mysql参考文章：ubuntu 安装mysql_ubuntu安装mysql-CSDN博客命令行导入sql文件【以Ubuntu为例】_ubuntu命令行下如何读取.sql-CSDN博客

2024-08-20 09:46:53 405

原创如何将sqlite3中数据导入到mysql中

1.安装sqlite3。

2024-08-20 09:10:29 522

原创 docker版本安装攻略

如果已经安装了 NVIDIA Container Toolkit，你应该能在输出中看到有关 NVIDIA 的信息。这个命令将输出一些关于 NVIDIA GPU 的信息，包括安装的驱动版本。如果这个命令返回了一个版本号，那么 Git LFS 已经安装在你的系统上。如果已安装 Docker 或 Docker Compose 但版本不符合要求，则需要卸载它们。如果已安装 Docker，此命令将输出当前安装的 Docker 版本。：如果是通过包管理器安装的 Docker Compose，可以用。

2024-06-04 15:41:40 1515 1

原创 Open-Webui和RAGFlow无法加载ollama模型

【代码】Open-Webui和RAGFlow无法加载ollama模型。

2024-05-08 10:40:25 5244

原创 NVIDIA Jetson系列，ARM架构创建docker容器

【代码】NVIDIA Jetson系列，ARM架构创建docker容器。

2024-03-18 10:53:53 761

原创 notpad++正则化，利用关键字符删除整行

首先，ctrl+f,选中[替换]，勾选正则表达式（可以勾选[匹配大小写]，不用勾选[匹配新行]）。在[查找目标]框输入[^(.*)"car_no_clean"(.*)$\n]。在$后加上\n，可以将被替换的行直接删除，不加则会将被替换的行变为空格。

2023-11-15 14:24:00 1893

原创 yolov5训练的时候txt标签中出现负值

【代码】yolov5训练的时候txt标签中出现负值。

2023-11-02 15:21:04 764

原创通用的ARM64架构镜像

此链接包含x86架构和ARM架构的pytorch镜像，镜像里面已下载好各种第三方库，GPU版本的pytorch可用。缺点：镜像有点大。

2023-08-29 16:32:08 817

原创华为鲲鹏+银河麒麟v10 安装 docker-ce

设备：硬件：仅有ARM处理器，无GPU和NPU，操作系统麒麟银河V10，Kunpeng-920#######参考原链接#########在 arm64(aarch64) 架构服务器上基于国产化操作系统安装 docker 服务。

2023-03-10 11:44:49 5151 7

原创麒麟银河操作系统下的英伟达驱动出现如下错误

麒麟银河v10

2022-11-15 10:43:36 1932 2

原创车载算法服务自启动Dockerfile

Dockerfile

2022-10-17 16:12:10 195

原创构建独立的redis容器

redis-server、docker

2022-10-12 10:26:00 441

原创 JetPack

jetson jetpack

2022-10-11 15:45:15 1021

原创训练yolov5出现的错误

yolov5和pytorch

2022-07-14 11:46:37 2181 3

原创 Kylin v10操作系统+ARM处理器+nvidia T4显卡编译GPU版本pytorch

ARM架构GPU 版本pytorch成功编译

2022-05-24 15:00:57 1740

原创银河麒麟操作系统安装nvidia-container-toolkit

ARM架构下安装nvidia-container-toolkitcurl -s -L https://nvidia.github.io/nvidia-docker/centos8/nvidia-docker.repo | sudo tee /etc/yum.repos.d/nvidia-docker.reposudo yum install -y nvidia-container-toolkitsudo systemctl restart dockernvidia-docker 存储库配置

2022-05-16 20:52:15 2680 1

原创 ARM架构上YOLOv5算法部署错误

报错：AttributeError: ‘Upsample‘ object has no attribute ‘recompute_scale_factor‘ 的解决方案解决办法：降低PyTorch的版本到1.9.0No module named ‘skimage‘解决办法：pip install scikit-image

2022-05-16 20:44:15 610

原创 PyTorch和TensorFlow轮子下载链接

#支持amd和x86,操作系统win、macos、linuxtensorflow · PyPI#支持amd、x86和aarch架构，操作系统win、macos、linuxtorch · PyPIarm架构下安装说明，参考链接如下：基于arm架构的ubuntu18 .04安装Anaconda3 + pytorch+python3.9_qq_41426807的博客-CSDN博客_arm ubuntu 安装教程...

2022-05-05 15:59:52 1625

原创在ARM64平台下安装TensorFlow和Pytorch

#TensorFlow安装包Releases · lhelontra/tensorflow-on-arm · GitHub#PyTorch安装过程基于arm架构的ubuntu18 .04安装Anaconda3 + pytorch+python3.9_qq_41426807的博客-CSDN博客_anaconda arm#PyTorch安装包torch · PyPI...

2022-04-29 10:37:07 1166

原创 ‘_RSAPublicKey‘ object has no attribute ‘verifier‘

'_RSAPublicKey' object has no attribute 'verifier'错误解决：pip install cryptography==36.0.2 #将版本返回到36.0.2版本；

2022-04-28 20:49:28 1433

原创 ARM64架构下安装PyTorch、TensorFlow以及python第三方库出现的错误

OSError: Could not find library geos_c or load any of its variants ['libgeos_c.so.1', 'libgeos_c.so']解决办法Ubuntu系统执行：sudo apt-get install libgeos-devCentOS系统执行：sudo yum install geos-devel报错：Check the logs for full command output解决：检查是否有这个驱动libpq.

2022-04-28 11:40:04 3120

原创 ResNet、ResNeXt

2022-04-28 11:17:05 135

原创 GPU compute capability（算力)和CUDA版本冲突问题

RuntimeError: CUDA error: no kernel image is available for execution on the deviceCUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

2022-01-13 14:32:02 7356

空空如也

空空如也