杨靳言先-CSDN博客

原创 ✨Obsidian CLI实战手册：从新手到效率大师的命令行指南

Obsidian CLI的优势在于自动化、批量处理、远程操作，无论是日常效率提升，还是复杂的知识库运维，都能帮你节省大量时间。不妨从一两个高频命令开始尝试（比如search），逐步探索更多功能，让你的Obsidian知识库管理更高效！👇。

2026-03-18 17:20:23 499

原创 ✨【运维实战】内网服务器无法联网？巧用 SSH 隧道实现反向代理访问公网资源 (Docker/PortForwarding)

通常我们用 SSH 都是从本地连到服务器。但 SSH 有一个强大的功能叫Remote Port Forwarding (反向端口转发)，参数是-R。简单来说，就是把服务器的某个端口，通过 SSH 隧道，“映射”回你本地电脑的某个端口。🗺️流量走向图解服务器发起请求➡️服务器 8888 端口➡️SSH 隧道 (加密运输)➡️本地电脑➡️本地 7890 代理端口➡️互联网通过 SSH 反向代理，我们无需在封闭的服务器网络环境中大动干戈，利用现有的 SSH 权限就能轻松实现“借网”。

2026-01-22 10:29:42 904 1

原创 ✨【企业实战】Linux挂载私有MinIO(S3)指南：离线安装+权限坑+“幽灵文件”排查全记录 [特殊字符]️

权限管理 🔐：在内网挂载时，务必在/etc/fstab中指定准确的uid和gid，配合，否则普通用户将寸步难行。性能认知 🐢：s3fs 本质是将 HTTP 请求模拟为文件操作。ls一个包含上万文件的目录会非常慢，这是正常现象。使用场景 🎯✅推荐：人工查阅文件、简单的 cp/mv 操作、低频读写、数据备份。❌不推荐：运行数据库、高频日志写入、编译代码（IO延迟极高）。MinIO 专有配置 💡：一定要加上，否则 DNS 解析会失败。希望这篇文章能帮你少踩几个坑！🚀❤️作者：杨靳言先版权声明。

2026-01-19 17:11:49 548

原创 ✨CentOS 7 离线升级 OpenSSH 7.8p1 实战全记录（附踩坑解决方案）

离线升级 OpenSSH 并不复杂，核心难点在于解决编译后的权限问题和配置项兼容问题。通过上述步骤，我们成功在 CentOS 7 离线环境中完成了升级，并修复了常见的启动报错。希望本文能帮到同样在内网奋斗的运维兄弟们！💪💪💪。

2026-01-06 09:11:18 902

原创 ✨2025 中文语音合成（TTS）全景调研·评测标准实战指南

1️⃣ 调研背景与目标2️⃣ 主流开源中文 TTS 模型对比（2025 推荐）3️⃣ 主流闭源商用 TTS 服务对比（2025 推荐）4️⃣ 评测方法论5️⃣ 实验平台与评测脚本6️⃣ 评测结果与分析7️⃣ 选型建议 & 实战指南8️⃣ 常见问题与 FAQ9️⃣ 参考资料 & 进一步阅读中文语音合成（Text‑to‑Speech，简称 TTS）已经从规则拼接时代跨入大模型端到端时代。本报告的核心目标：总分=∑i=14wi×维度得分i+w5×(1−响应时间−min⁡(RT)max⁡(

2025-08-28 10:36:17 3890

原创 ✨一文读懂儿童语音识别：ChildMandarin 数据集上离线/实时模型的全面评测、前处理收益与最适合教育场景的模型榜单

关键点结论前处理收益火山、讯飞等模型在去标点、数字汉化后CER 降幅 > 50%，说明它们的语言模型对标点/数字非常敏感。离线 vs 实时Paraformer系列在离线/实时两种模式下误差几乎相同，证明该架构的流式解码设计非常稳健。模型规模不等价于儿童表现Whisper‑large‑v3（1.5 B 参数）在儿童数据上仍不如火山离线（≈250 M），说明数据匹配度模型容量。方言鲁棒性火山、讯飞在多省份数据上表现较好，说明它们在方言自适应上做了大量工作。实时性。

2025-08-28 10:17:13 1238

原创 ✨OpenVoice 全流程实战：多语言语音合成系统安装与使用教程（附踩坑经验）

OpenVoice 是由MyShell AI支持任意语言输入提取语音特征，合成相似音色的多语言语音适用于虚拟主播、智能语音助手、视频配音等场景简单说：你只要上传一段录音，它就能学到“你的说话方式”，然后用这个音色生成其他语言的语音。OpenVoice 提供了现代语音合成系统所需的所有关键能力：✅ 多语言语音生成✅ 支持音色特征提取✅ 自定义演示、Gradio 支持✅ 适合研究与应用开发。

2025-08-05 11:04:50 1260

原创 ✨本地语音识别新选择：用 Vosk 轻松实现离线语音转文字

Vosk 适合本地部署低资源设备实时语音识别场景。虽然识别准确率可能略逊于 Whisper 等大模型，但其轻量化、易部署的特性使其在特定场景中极具优势。非常适合用于语音助手、语音控制、嵌入式设备开发等项目。如果你正在寻找一个简单、高效、低门槛的语音识别方案，不妨试试 Vosk！它可能不是最强大的，但一定是最易上手的一个。

2025-07-22 11:36:31 1391

原创 ✨ FastMCP 实战进阶：构建可远程访问的 MCP 工具服务与客户端（Python 深度解析）

mcp.toolif b == 0:raise error.ToolError("除数不能为0")通过本文你已经掌握如何使用 FastMCP 构建一个支持 HTTP 通信的远程工具服务，并实现客户端的异步调用与流式响应。AI Agent 工具链大模型插件服务智能助手后端企业级 API 服务FastMCP 让你专注于编写高质量的 Python 函数，而不用关心底层的 JSON-RPC 协议与通信细节。希望本教程能帮助你快速上手 FastMCP，并在实际项目中加以应用。

2025-07-11 15:35:19 1472 2

原创 ✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案（保姆级教程）

在使用😵 明明数据流一切正常，程序也没报错，为何最后却让人崩溃？本教程将以完整案例 + 原始与修改代码对比 + 每一步讲解，手把手教你如何快速定位并优雅规避这个问题。✅建议优先使用替代，尤其在 Linux / Docker / 无桌面服务器等复杂环境中。dtype是否正确（float32orint16音频是否为单通道还是多通道？是否含有无效数据（如空 response）？保存路径是否可写？💬调试时记得打印 shape、dtype、内容片段，快速定位问题！

2025-06-26 10:38:33 1254

原创 ✨从零搭建 Ubuntu22.04 + Python3.11 + PyTorch2.5.1 GPU Docker 镜像并上传 Docker Hub

构建一个带 GPU 支持的深度学习开发镜像；使用 PyTorch 2.5.1（CUDA 12.4）环境；发布并托管 Docker 镜像至 Docker Hub；验证 GPU 环境正常运行！🎉 这将极大提升你的项目部署效率，尤其是在多人协作或跨平台部署场景中。

2025-06-24 14:13:38 1519 4

原创 ✨通义万相2.1深度解析：AI视频生成引擎FLF2V-14B全流程指南（命令行参数+模型架构+数据流）

输入：文字描述 + 首尾帧编码：文本/图像信息转化为向量生成：扩散模型逐步生成中间帧解码：将抽象表示转为高清图像输出：合成最终视频文件。

2025-06-23 14:23:06 1226

原创 ✨通义万相 2.1（Wan2.1）环境搭建指南：基于 CUDA 12.4 + Python 3.11 + PyTorch 2.5.1 GPU加速实战

🚀 完成以上所有步骤，你的 Wan2.1 项目环境就搭建完成了，可以放心训练和测试了！如果你在构建或运行中遇到其他奇怪的问题，也欢迎留言，我会第一时间解答。

2025-06-22 17:06:13 1636

原创 ✨自定义 CUDA 与 Python 容器：实现 Diffusers 和 vLLM 大模型极速推理

CUDA：NVIDIA 推出的 GPU 并行计算平台和编程模型，极大提升计算密集型任务速度。：专为容器运行时提供 GPU 访问支持，确保容器内的程序能利用宿主机 GPU。CUDA 容器镜像：NVIDIA 官方提供，包含 CUDA 运行时和开发工具，方便开发者搭建环境。我们用 Docker + NVIDIA Container Toolkit 来运行基于 GPU 的容器。通过 NVIDIA 官方 CUDA 容器快速搭建 GPU 加速环境自定义安装 Python 3.11，满足最新大模型库需求。

2025-06-22 16:02:32 976

原创 ✨NVIDIA Container Runtime 与 CUDA Runtime：vLLM 容器环境深度解析

简单说，是 NVIDIA 官方给 Docker 设计的“GPU通行证”，让 Docker 容器能访问宿主机的 NVIDIA GPU。安装在宿主机上负责把容器的 GPU 请求安全地转发给宿主机 GPU 驱动运行 GPU 容器时必须用到，比如加--gpus all参数没装好，GPU 就“见不到”容器了！是 CUDA 软件里的运行时库，包含 GPU 编程接口和开发头文件，提供 GPU 加速能力的核心工具包。在容器内（或者宿主机）安装负责实际的 GPU 计算操作的 API 调用。

2025-06-22 12:48:23 1168

原创 ✨CUDA Docker镜像详解 | 小白必看，从入门到精通

简单说，CUDA Docker镜像是NVIDIA官方发布的一套包含CUDA运行环境和开发工具的Docker镜像。通过它，你可以快速搭建一个支持GPU加速的容器环境，免去复杂的环境配置。尤其适合做深度学习、科学计算、GPU编程。镜像版本包含内容适用场景非Docker环境对应组件runtimeCUDA运行时动态库只跑程序，部署模型develruntime + nvcc编译器 + 头文件开发、编译CUDA程序runtime + cuDNN运行库运行深度学习模型。

2025-06-22 12:41:35 1305 2

原创 ✨使用 vLLM + Docker 部署 Qwen3-Embedding-8B 并实现高效文本向量生成（附 `curl` 测试）

本文介绍了如何使用 vLLM 和 Docker 部署 Qwen3-Embedding-8B 嵌入模型服务，并通过标准 OpenAI 兼容接口进行调用和结果解析。如果你在部署中遇到任何问题，欢迎留言讨论！

2025-06-22 01:28:38 6043 3

原创 ✨Qwen3-Embedding 向量维度选择与自定义输出终极指南（含实战 + 原理详解）

Qwen3-Embedding 是阿里通义推出的专为文本嵌入任务打造的模型系列，支持超过100+语言和代码检索场景。模型名称参数量默认维度支持自定义维度MTEB 英文平均分0.6B1024✅ 支持 32~102470.704B2560✅ 支持 32~256074.608B4096✅ 支持 32~4096🥇75.22支持在 32 到 4096 之间自定义输出维度。但默认输出仍是最大值，比如 8B 模型默认输出为 4096 维。那么如何调整呢？✅。

2025-06-20 11:39:58 8660 11

原创 ✨一文搞懂公网文件服务器部署：Python / FTP / WebDAV / Nextcloud 全方案实战

公网服务器、文件服务器、Python HTTP、FTP、WebDAV、Nextcloud、Ubuntu、Linux 运维、文件共享、云盘、自建网盘

2025-06-19 10:41:26 851

原创 ✨Python实战 | 精准评估ASR识别结果的字符错误率（CER）

字符错误率（Character Error Rate）是计算识别文本与标准文本在字符层面的编辑距离的指标。它衡量了需要多少字符级的替换、插入和删除操作，来将识别结果转换为标准文本。CERSDINCERNSDISSS：替换（Substitutions）字符数DDD：删除（Deletions）字符数III：插入（Insertions）字符数NNN：标准文本中的字符总数CER值越小，说明识别结果越接近标准答案，通常CER为0表示完全匹配。

2025-06-19 10:13:43 1548

原创 ✨Locust 压测技巧 | 自定义指标采集与首token响应时间统计全攻略

Locust 原生只自动统计请求总响应时间，要统计首token响应时间，需要通过事件机制自定义上报指标。# 自定义事件，通知Locust统计首token响应时间request_type="http", # 请求类型，建议用"http"name="chat_first_token_delay", # 自定义指标名response_time=first_token_delay, # 单位毫秒response_length=0, # 可填0或者长度context=self # 传入当前环境，方便跟踪。

2025-06-16 14:09:34 1368

原创 ✨Docker官方 Python 3.10 镜像中安装 FFmpeg 全流程详解（含依赖修复 & 清华源加速）

FFmpeg是音视频处理领域的万能工具，支持格式转换、剪辑、转码、提取音频等功能。在使用 OpenAI 的whisper、语音识别、音频切割等任务中，ffmpeg常常是必不可少的依赖。在官方的Docker 镜像中默认没有预装，直接安装也常常遇到依赖缺失或源连接失败等问题，因此需要一点“姿势”。项目是否完成替换清华源 ✅✅安装 ffmpeg ✅✅修复依赖 ✅✅验证版本 ✅✅👍 完成以上步骤后，你就可以在 Python 中直接调用ffmpeg。

2025-06-12 10:03:58 1211

原创 ✨Whisper 官方版本离线安装及断点续传下载 + screen 后台管理全流程指南

环境准备齐全，安装 Python、ffmpeg、wget、screen采用官方 Whisper，保证稳定与兼容使用断点续传，避免下载中断导致失败利用 screen 实现后台稳定运行简洁 Python 调用示例快速上手以上流程适用于各种 Linux 服务器或本地开发环境，助你轻松完成 Whisper 离线安装及模型管理！一起学习进步 ✨。

2025-06-12 09:44:08 2279

原创 ✨Node.js + Vite + React 在 Linux Docker 中开发指南（含后台运行技巧）

使用 Node.js 22 + Docker 环境，快速搭建 Vite + React 前端开发环境，支持后台运行、跨平台挂载、持久开发。在该页面可以查看所有支持的版本、Alpine/Slime 等不同变体的说明与用法。✅ 推荐使用长期支持版本（LTS），更加稳定。，可以实时同步代码，防止数据丢失。将本地项目目录挂载到容器中的。

2025-06-11 15:06:28 612

原创 ✨Windows 下超快 Python 包管理器 `uv` 安装教程（附图文详解）

uv是由Astralpip（安装依赖）（创建虚拟环境）pip-tools（生成 requirements.txt）并做到更快、更简单！功能状态替代✅ 安装依赖完全支持pip✅ 创建虚拟环境内置支持✅ 生成锁文件支持 pyproject.toml / pylock.toml🚀 性能极快（Rust 编写）——优点描述⚡ 极快基于 Rust，10 倍 pip 安装速度🧹 干净默认不会污染全局环境🔒 安全自带锁文件生成📦 通用。

2025-06-11 14:49:36 10691

原创 ✨【离线安装 Locust 到 Docker 容器】超详细实操指南（附镜像打包）

🚫网络受限环境：生产环境、私有网络或安全策略限制，Docker 容器无法直接访问互联网。🔒版本稳定性需求：需要控制 Locust 及依赖版本，防止网络更新导致环境不一致。⚡提高部署效率：避免每次启动容器都要重新下载依赖，加快启动速度。

2025-06-11 14:26:02 540

原创 ✨如何在 vLLM 中取消 Qwen3 的 Thinking 模式

/think>I am ...在某些场景下，你可能希望跳过这部分内容，直接获取模型的输出结果。以下将介绍两种实现方式。方法实现方式优点缺点方法一设置完全跳过 Thinking 提示需要修改代码方法二在输入末尾添加/no_think实现简单仍输出 Thinking token希望这篇文章能帮助你更好地理解 Qwen3 在 vLLM 中的使用方式。如果你还有更多关于 Qwen3、vLLM 或大模型部署的问题，欢迎留言交流！

2025-05-12 11:42:08 23646 3

原创 ✨零基础手把手｜Docker+vLLM极速部署OpenAI风格API：5分钟4卡GPU推理+避坑指南+完整镜像配置

查看镜像列表二、镜像与容器操作镜像打包为文件打包多个镜像到一个文件从容器创建镜像加载镜像文件修改镜像名和版本删除旧镜像三、命令详解示例命令拆解：参数解释：构建镜像：五、清理缓存与资源清理未使用的资源清理指定镜像/容器六、切换 Docker 存储路径修改 Docker 数据目录七、dockercompose以下是基于命令编写的 ****文件，并附带详细注释和操作说明：操作步骤创建文件将上述内容保存为。

2025-05-02 16:23:25 1364

原创 ✨零基础手把手｜Docker+vLLM极速部署OpenAI风格API：5分钟4卡GPU推理+避坑指南+完整镜像配置

/data02/YangXian/models/Qwen/Qwen3-30B-A3B:/workspace/models # 挂载模型目录。device_ids: ['4', '5', '6', '7'] # 指定 GPU 设备号。- /data02/log:/var/log/vllm # 挂载日志目录。# 2. 修改配置文件（如 /etc/docker/daemon.json）- "8002:8000" # 端口映射（主机端口:容器端口）ipc: host # 共享主机 IPC 命名空间。

2025-05-02 16:11:23 1777

原创 GLM-4-0414启动该模型会遇到 linear(): argument ‘input‘ (position 1) must be Tensor not tuple报错已解决！！

构建镜像的时候，Docker 需要读取：你的 Dockerfile还有 Dockerfile 里面用到的其他文件（比如 COPY、ADD 的文件）这些必须都在所谓的构建上下文目录里面。而这个点（）就是告诉 Docker：🧠“以当前目录为根目录，打包里面所有需要的文件。

2025-04-27 10:10:35 1360

用大模型重构生活：猫奴程序员的AI智能日常记录

原创 ✨Obsidian CLI实战手册：从新手到效率大师的命令行指南

原创 ✨【运维实战】内网服务器无法联网？巧用 SSH 隧道实现反向代理访问公网资源 (Docker/PortForwarding)

原创 ✨【企业实战】Linux挂载私有MinIO(S3)指南：离线安装+权限坑+“幽灵文件”排查全记录 [特殊字符]️

原创 ✨CentOS 7 离线升级 OpenSSH 7.8p1 实战全记录（附踩坑解决方案）

原创 ✨2025 中文语音合成（TTS）全景调研·评测标准实战指南

原创 ✨一文读懂儿童语音识别：ChildMandarin 数据集上离线/实时模型的全面评测、前处理收益与最适合教育场景的模型榜单

原创 ✨OpenVoice 全流程实战：多语言语音合成系统安装与使用教程（附踩坑经验）

原创 ✨本地语音识别新选择：用 Vosk 轻松实现离线语音转文字

原创 ✨ FastMCP 实战进阶：构建可远程访问的 MCP 工具服务与客户端（Python 深度解析）

原创 ✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案（保姆级教程）

原创 ✨从零搭建 Ubuntu22.04 + Python3.11 + PyTorch2.5.1 GPU Docker 镜像并上传 Docker Hub

原创 ✨通义万相2.1深度解析：AI视频生成引擎FLF2V-14B全流程指南（命令行参数+模型架构+数据流）

原创 ✨通义万相 2.1（Wan2.1）环境搭建指南：基于 CUDA 12.4 + Python 3.11 + PyTorch 2.5.1 GPU加速实战

原创 ✨自定义 CUDA 与 Python 容器：实现 Diffusers 和 vLLM 大模型极速推理

原创 ✨NVIDIA Container Runtime 与 CUDA Runtime：vLLM 容器环境深度解析

原创 ✨CUDA Docker镜像详解 | 小白必看，从入门到精通

原创 ✨使用 vLLM + Docker 部署 Qwen3-Embedding-8B 并实现高效文本向量生成（附 `curl` 测试）

原创 ✨Qwen3-Embedding 向量维度选择与自定义输出终极指南（含实战 + 原理详解）

原创 ✨一文搞懂公网文件服务器部署：Python / FTP / WebDAV / Nextcloud 全方案实战

原创 ✨Python实战 | 精准评估ASR识别结果的字符错误率（CER）

原创 ✨Locust 压测技巧 | 自定义指标采集与首token响应时间统计全攻略

原创 ✨Docker官方 Python 3.10 镜像中安装 FFmpeg 全流程详解（含依赖修复 & 清华源加速）

原创 ✨Whisper 官方版本离线安装及断点续传下载 + screen 后台管理全流程指南

原创 ✨Node.js + Vite + React 在 Linux Docker 中开发指南（含后台运行技巧）

原创 ✨Windows 下超快 Python 包管理器 `uv` 安装教程（附图文详解）

原创 ✨【离线安装 Locust 到 Docker 容器】超详细实操指南（附镜像打包）

原创 ✨如何在 vLLM 中取消 Qwen3 的 Thinking 模式

原创 ✨零基础手把手｜Docker+vLLM极速部署OpenAI风格API：5分钟4卡GPU推理+避坑指南+完整镜像配置

原创 ✨零基础手把手｜Docker+vLLM极速部署OpenAI风格API：5分钟4卡GPU推理+避坑指南+完整镜像配置

原创 GLM-4-0414启动该模型会遇到 linear(): argument ‘input‘ (position 1) must be Tensor not tuple报错已解决！！

空空如也

空空如也