- 博客(30)
- 收藏
- 关注
原创 ✨Obsidian CLI实战手册:从新手到效率大师的命令行指南
Obsidian CLI的优势在于自动化、批量处理、远程操作,无论是日常效率提升,还是复杂的知识库运维,都能帮你节省大量时间。不妨从一两个高频命令开始尝试(比如search),逐步探索更多功能,让你的Obsidian知识库管理更高效!👇。
2026-03-18 17:20:23
499
原创 ✨【运维实战】内网服务器无法联网?巧用 SSH 隧道实现反向代理访问公网资源 (Docker/PortForwarding)
通常我们用 SSH 都是从本地连到服务器。但 SSH 有一个强大的功能叫Remote Port Forwarding (反向端口转发),参数是-R。简单来说,就是把服务器的某个端口,通过 SSH 隧道,“映射”回你本地电脑的某个端口。🗺️流量走向图解服务器发起请求➡️服务器 8888 端口➡️SSH 隧道 (加密运输)➡️本地电脑➡️本地 7890 代理端口➡️互联网通过 SSH 反向代理,我们无需在封闭的服务器网络环境中大动干戈,利用现有的 SSH 权限就能轻松实现“借网”。
2026-01-22 10:29:42
904
1
原创 ✨【企业实战】Linux挂载私有MinIO(S3)指南:离线安装+权限坑+“幽灵文件”排查全记录 [特殊字符]️
权限管理 🔐:在内网挂载时,务必在/etc/fstab中指定准确的uid和gid,配合,否则普通用户将寸步难行。性能认知 🐢:s3fs 本质是将 HTTP 请求模拟为文件操作。ls一个包含上万文件的目录会非常慢,这是正常现象。使用场景 🎯✅推荐:人工查阅文件、简单的 cp/mv 操作、低频读写、数据备份。❌不推荐:运行数据库、高频日志写入、编译代码(IO延迟极高)。MinIO 专有配置 💡:一定要加上,否则 DNS 解析会失败。希望这篇文章能帮你少踩几个坑!🚀❤️作者:杨靳言先版权声明。
2026-01-19 17:11:49
548
原创 ✨CentOS 7 离线升级 OpenSSH 7.8p1 实战全记录(附踩坑解决方案)
离线升级 OpenSSH 并不复杂,核心难点在于解决编译后的权限问题和配置项兼容问题。通过上述步骤,我们成功在 CentOS 7 离线环境中完成了升级,并修复了常见的启动报错。希望本文能帮到同样在内网奋斗的运维兄弟们!💪💪💪。
2026-01-06 09:11:18
902
原创 ✨2025 中文语音合成(TTS)全景调研·评测标准实战指南
1️⃣ 调研背景与目标2️⃣ 主流开源中文 TTS 模型对比(2025 推荐)3️⃣ 主流闭源商用 TTS 服务对比(2025 推荐)4️⃣ 评测方法论5️⃣ 实验平台与评测脚本6️⃣ 评测结果与分析7️⃣ 选型建议 & 实战指南8️⃣ 常见问题与 FAQ9️⃣ 参考资料 & 进一步阅读中文语音合成(Text‑to‑Speech,简称 TTS)已经从 规则拼接 时代跨入 大模型端到端 时代。本报告的 核心目标:总分=∑i=14wi×维度得分i+w5×(1−响应时间−min(RT)max(
2025-08-28 10:36:17
3890
原创 ✨一文读懂儿童语音识别:ChildMandarin 数据集上离线/实时模型的全面评测、前处理收益与最适合教育场景的模型榜单
关键点结论前处理收益火山、讯飞等模型在去标点、数字汉化后CER 降幅 > 50%,说明它们的语言模型对标点/数字非常敏感。离线 vs 实时Paraformer系列在离线/实时两种模式下误差几乎相同,证明该架构的流式解码设计非常稳健。模型规模不等价于儿童表现Whisper‑large‑v3(1.5 B 参数)在儿童数据上仍不如火山离线(≈250 M),说明数据匹配度模型容量。方言鲁棒性火山、讯飞在多省份数据上表现较好,说明它们在方言自适应上做了大量工作。实时性。
2025-08-28 10:17:13
1238
原创 ✨OpenVoice 全流程实战:多语言语音合成系统安装与使用教程(附踩坑经验)
OpenVoice 是由MyShell AI支持任意语言输入提取语音特征,合成相似音色的多语言语音适用于虚拟主播、智能语音助手、视频配音等场景简单说:你只要上传一段录音,它就能学到“你的说话方式”,然后用这个音色生成其他语言的语音。OpenVoice 提供了现代语音合成系统所需的所有关键能力:✅ 多语言语音生成✅ 支持音色特征提取✅ 自定义演示、Gradio 支持✅ 适合研究与应用开发。
2025-08-05 11:04:50
1260
原创 ✨本地语音识别新选择:用 Vosk 轻松实现离线语音转文字
Vosk 适合本地部署低资源设备实时语音识别场景。虽然识别准确率可能略逊于 Whisper 等大模型,但其轻量化、易部署的特性使其在特定场景中极具优势。非常适合用于语音助手、语音控制、嵌入式设备开发等项目。如果你正在寻找一个简单、高效、低门槛的语音识别方案,不妨试试 Vosk!它可能不是最强大的,但一定是最易上手的一个。
2025-07-22 11:36:31
1391
原创 ✨ FastMCP 实战进阶:构建可远程访问的 MCP 工具服务与客户端(Python 深度解析)
mcp.toolif b == 0:raise error.ToolError("除数不能为0")通过本文你已经掌握如何使用 FastMCP 构建一个支持 HTTP 通信的远程工具服务,并实现客户端的异步调用与流式响应。AI Agent 工具链大模型插件服务智能助手后端企业级 API 服务FastMCP 让你专注于编写高质量的 Python 函数,而不用关心底层的 JSON-RPC 协议与通信细节。希望本教程能帮助你快速上手 FastMCP,并在实际项目中加以应用。
2025-07-11 15:35:19
1472
2
原创 ✨【CosyVoice2-0.5B 实战】Segmentation fault (core dumped) 终极解决方案 (保姆级教程)
在使用😵 明明数据流一切正常,程序也没报错,为何最后却让人崩溃?本教程将以完整案例 + 原始与修改代码对比 + 每一步讲解,手把手教你如何快速定位并优雅规避这个问题。✅建议优先使用替代,尤其在 Linux / Docker / 无桌面服务器等复杂环境中。dtype是否正确(float32orint16音频是否为单通道还是多通道?是否含有无效数据(如空 response)?保存路径是否可写?💬调试时记得打印 shape、dtype、内容片段,快速定位问题!
2025-06-26 10:38:33
1254
原创 ✨从零搭建 Ubuntu22.04 + Python3.11 + PyTorch2.5.1 GPU Docker 镜像并上传 Docker Hub
构建一个带 GPU 支持的深度学习开发镜像;使用 PyTorch 2.5.1(CUDA 12.4)环境;发布并托管 Docker 镜像至 Docker Hub;验证 GPU 环境正常运行!🎉 这将极大提升你的项目部署效率,尤其是在多人协作或跨平台部署场景中。
2025-06-24 14:13:38
1519
4
原创 ✨通义万相2.1深度解析:AI视频生成引擎FLF2V-14B全流程指南(命令行参数+模型架构+数据流)
输入:文字描述 + 首尾帧编码:文本/图像信息转化为向量生成:扩散模型逐步生成中间帧解码:将抽象表示转为高清图像输出:合成最终视频文件。
2025-06-23 14:23:06
1226
原创 ✨通义万相 2.1(Wan2.1)环境搭建指南:基于 CUDA 12.4 + Python 3.11 + PyTorch 2.5.1 GPU加速实战
🚀 完成以上所有步骤,你的 Wan2.1 项目环境就搭建完成了,可以放心训练和测试了!如果你在构建或运行中遇到其他奇怪的问题,也欢迎留言,我会第一时间解答。
2025-06-22 17:06:13
1636
原创 ✨自定义 CUDA 与 Python 容器:实现 Diffusers 和 vLLM 大模型极速推理
CUDA:NVIDIA 推出的 GPU 并行计算平台和编程模型,极大提升计算密集型任务速度。:专为容器运行时提供 GPU 访问支持,确保容器内的程序能利用宿主机 GPU。CUDA 容器镜像:NVIDIA 官方提供,包含 CUDA 运行时和开发工具,方便开发者搭建环境。我们用 Docker + NVIDIA Container Toolkit 来运行基于 GPU 的容器。通过 NVIDIA 官方 CUDA 容器快速搭建 GPU 加速环境自定义安装 Python 3.11,满足最新大模型库需求。
2025-06-22 16:02:32
976
原创 ✨NVIDIA Container Runtime 与 CUDA Runtime:vLLM 容器环境深度解析
简单说,是 NVIDIA 官方给 Docker 设计的“GPU通行证”,让 Docker 容器能访问宿主机的 NVIDIA GPU。安装在宿主机上负责把容器的 GPU 请求安全地转发给宿主机 GPU 驱动运行 GPU 容器时必须用到,比如加--gpus all参数没装好,GPU 就“见不到”容器了!是 CUDA 软件里的运行时库,包含 GPU 编程接口和开发头文件,提供 GPU 加速能力的核心工具包。在容器内(或者宿主机)安装负责实际的 GPU 计算操作的 API 调用。
2025-06-22 12:48:23
1168
原创 ✨CUDA Docker镜像详解 | 小白必看,从入门到精通
简单说,CUDA Docker镜像是NVIDIA官方发布的一套包含CUDA运行环境和开发工具的Docker镜像。通过它,你可以快速搭建一个支持GPU加速的容器环境,免去复杂的环境配置。尤其适合做深度学习、科学计算、GPU编程。镜像版本包含内容适用场景非Docker环境对应组件runtimeCUDA运行时动态库只跑程序,部署模型develruntime + nvcc编译器 + 头文件开发、编译CUDA程序runtime + cuDNN运行库运行深度学习模型。
2025-06-22 12:41:35
1305
2
原创 ✨使用 vLLM + Docker 部署 Qwen3-Embedding-8B 并实现高效文本向量生成(附 `curl` 测试)
本文介绍了如何使用 vLLM 和 Docker 部署 Qwen3-Embedding-8B 嵌入模型服务,并通过标准 OpenAI 兼容接口进行调用和结果解析。如果你在部署中遇到任何问题,欢迎留言讨论!
2025-06-22 01:28:38
6043
3
原创 ✨Qwen3-Embedding 向量维度选择与自定义输出终极指南(含实战 + 原理详解)
Qwen3-Embedding 是阿里通义推出的专为文本嵌入任务打造的模型系列,支持超过100+语言和代码检索场景。模型名称参数量默认维度支持自定义维度MTEB 英文平均分0.6B1024✅ 支持 32~102470.704B2560✅ 支持 32~256074.608B4096✅ 支持 32~4096🥇75.22支持在 32 到 4096 之间自定义输出维度。但默认输出仍是最大值,比如 8B 模型默认输出为 4096 维。那么如何调整呢?✅。
2025-06-20 11:39:58
8660
11
原创 ✨一文搞懂公网文件服务器部署:Python / FTP / WebDAV / Nextcloud 全方案实战
公网服务器、文件服务器、Python HTTP、FTP、WebDAV、Nextcloud、Ubuntu、Linux 运维、文件共享、云盘、自建网盘
2025-06-19 10:41:26
851
原创 ✨Python实战 | 精准评估ASR识别结果的字符错误率(CER)
字符错误率(Character Error Rate)是计算识别文本与标准文本在字符层面的编辑距离的指标。它衡量了需要多少字符级的替换、插入和删除操作,来将识别结果转换为标准文本。CERSDINCERNSDISSS:替换(Substitutions)字符数DDD:删除(Deletions)字符数III:插入(Insertions)字符数NNN:标准文本中的字符总数CER值越小,说明识别结果越接近标准答案,通常CER为0表示完全匹配。
2025-06-19 10:13:43
1548
原创 ✨Locust 压测技巧 | 自定义指标采集与首token响应时间统计全攻略
Locust 原生只自动统计请求总响应时间,要统计首token响应时间,需要通过事件机制自定义上报指标。# 自定义事件,通知Locust统计首token响应时间request_type="http", # 请求类型,建议用"http"name="chat_first_token_delay", # 自定义指标名response_time=first_token_delay, # 单位毫秒response_length=0, # 可填0或者长度context=self # 传入当前环境,方便跟踪。
2025-06-16 14:09:34
1368
原创 ✨Docker官方 Python 3.10 镜像中安装 FFmpeg 全流程详解(含依赖修复 & 清华源加速)
FFmpeg是音视频处理领域的万能工具,支持格式转换、剪辑、转码、提取音频等功能。在使用 OpenAI 的whisper、语音识别、音频切割等任务中,ffmpeg常常是必不可少的依赖。在官方的Docker 镜像中默认没有预装,直接安装也常常遇到依赖缺失或源连接失败等问题,因此需要一点“姿势”。项目是否完成替换清华源 ✅✅安装 ffmpeg ✅✅修复依赖 ✅✅验证版本 ✅✅👍 完成以上步骤后,你就可以在 Python 中直接调用ffmpeg。
2025-06-12 10:03:58
1211
原创 ✨Whisper 官方版本离线安装及断点续传下载 + screen 后台管理全流程指南
环境准备齐全,安装 Python、ffmpeg、wget、screen采用官方 Whisper,保证稳定与兼容使用断点续传,避免下载中断导致失败利用 screen 实现后台稳定运行简洁 Python 调用示例快速上手以上流程适用于各种 Linux 服务器或本地开发环境,助你轻松完成 Whisper 离线安装及模型管理!一起学习进步 ✨。
2025-06-12 09:44:08
2279
原创 ✨Node.js + Vite + React 在 Linux Docker 中开发指南(含后台运行技巧)
使用 Node.js 22 + Docker 环境,快速搭建 Vite + React 前端开发环境,支持后台运行、跨平台挂载、持久开发。在该页面可以查看所有支持的版本、Alpine/Slime 等不同变体的说明与用法。✅ 推荐使用长期支持版本(LTS),更加稳定。,可以实时同步代码,防止数据丢失。将本地项目目录挂载到容器中的。
2025-06-11 15:06:28
612
原创 ✨Windows 下超快 Python 包管理器 `uv` 安装教程(附图文详解)
uv是由Astralpip(安装依赖)(创建虚拟环境)pip-tools(生成 requirements.txt)并做到更快、更简单!功能状态替代✅ 安装依赖完全支持pip✅ 创建虚拟环境内置支持✅ 生成锁文件支持 pyproject.toml / pylock.toml🚀 性能极快(Rust 编写)——优点描述⚡ 极快基于 Rust,10 倍 pip 安装速度🧹 干净默认不会污染全局环境🔒 安全自带锁文件生成📦 通用。
2025-06-11 14:49:36
10691
原创 ✨【离线安装 Locust 到 Docker 容器】超详细实操指南(附镜像打包)
🚫网络受限环境:生产环境、私有网络或安全策略限制,Docker 容器无法直接访问互联网。🔒版本稳定性需求:需要控制 Locust 及依赖版本,防止网络更新导致环境不一致。⚡提高部署效率:避免每次启动容器都要重新下载依赖,加快启动速度。
2025-06-11 14:26:02
540
原创 ✨如何在 vLLM 中取消 Qwen3 的 Thinking 模式
/think>I am ...在某些场景下,你可能希望跳过这部分内容,直接获取模型的输出结果。以下将介绍两种实现方式。方法实现方式优点缺点方法一设置完全跳过 Thinking 提示需要修改代码方法二在输入末尾添加/no_think实现简单仍输出 Thinking token希望这篇文章能帮助你更好地理解 Qwen3 在 vLLM 中的使用方式。如果你还有更多关于 Qwen3、vLLM 或大模型部署的问题,欢迎留言交流!
2025-05-12 11:42:08
23646
3
原创 ✨零基础手把手|Docker+vLLM极速部署OpenAI风格API:5分钟4卡GPU推理+避坑指南+完整镜像配置
查看镜像列表二、镜像与容器操作镜像打包为 文件打包多个镜像到一个文件从容器创建镜像加载 镜像文件修改镜像名和版本删除旧镜像三、 命令详解示例命令拆解:参数解释:构建镜像:五、清理缓存与资源清理未使用的资源清理指定镜像/容器六、切换 Docker 存储路径修改 Docker 数据目录七、dockercompose以下是基于 命令编写的 ****文件,并附带详细注释和操作说明:操作步骤创建 文件将上述内容保存为 。
2025-05-02 16:23:25
1364
原创 ✨零基础手把手|Docker+vLLM极速部署OpenAI风格API:5分钟4卡GPU推理+避坑指南+完整镜像配置
/data02/YangXian/models/Qwen/Qwen3-30B-A3B:/workspace/models # 挂载模型目录。device_ids: ['4', '5', '6', '7'] # 指定 GPU 设备号。- /data02/log:/var/log/vllm # 挂载日志目录。# 2. 修改配置文件(如 /etc/docker/daemon.json)- "8002:8000" # 端口映射(主机端口:容器端口)ipc: host # 共享主机 IPC 命名空间。
2025-05-02 16:11:23
1777
原创 GLM-4-0414启动该模型会遇到 linear(): argument ‘input‘ (position 1) must be Tensor not tuple报错已解决!!
构建镜像的时候,Docker 需要读取:你的 Dockerfile还有 Dockerfile 里面用到的其他文件(比如 COPY、ADD 的文件)这些必须都在所谓的构建上下文目录里面。而这个点()就是告诉 Docker:🧠“以当前目录为根目录,打包里面所有需要的文件。
2025-04-27 10:10:35
1360
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅