『托尼』-CSDN博客

原创 Whisper微调实战：从数据到语音识别

本项目提供了一个基于OpenAI Whisper模型的语音识别微调方案。主要流程包括：1) 数据准备，使用音频切割工具和doccano标注平台处理数据；2) 环境配置，基于conda安装79个依赖库；3) 模型训练，采用动态LoRA策略（根据训练步数自动选择标准LoRA或AdaLoRA）；4) 模型验证，评估字符错误率等指标。项目针对中文优化，支持JSONL格式数据集，提供从数据预处理到模型验证的完整实施方案。关键创新点是训练参数动态调整机制，根据训练步数自动选择最优微调策略。

2025-08-20 17:52:24 342 1

原创实战指南：构建支持语音对话的后端服务与数据持久化

本文详细介绍了水务行业智能客服系统后端服务的构建方案，重点包括三部分：1)采用PostgreSQL设计voice_logs表，通过会话ID串联对话记录；2)制定语音文件存储策略，采用时间戳+会话ID的命名规范；3)实现Python Flask服务代码，包括数据库连接、日志服务API接口及主控制器调用流程。系统采用微服务架构，确保数据安全性和可维护性，为智能客服应用提供可靠的后端支持。

2025-07-04 11:31:39 825

原创新手指南：在 Ubuntu 上安装 PostgreSQL 并通过 VS Code 连接及操作

本文详细记录了在Ubuntu系统上安装PostgreSQL数据库、配置连接以及创建客服对话数据表的过程。作者从初学者角度出发，逐一解决了安装服务缺失、排序规则冲突、数据库连接错误、表创建失败等常见问题。通过终端命令和VSCode客户端配合，最终成功创建了包含客户输入/时间、机器人输出/时间等字段的conversations表，并完成数据插入和查询操作。本文为新手提供了可复现的PostgreSQL操作指南，展示了从安装到实际应用的完整流程，有助于理解数据库管理的基本原理。

2025-06-30 16:34:17 918

原创一次完整的 SQL Server 备份恢复与数据勘探之旅（实战复盘版）

本文详细记录了从零开始处理未知SQL Server备份文件(.bak)的全过程。通过三个阶段展现了技术排错与数据发现的方法论：1)环境准备与连接阶段，克服SSL证书验证问题成功连接；2)备份文件勘探阶段，解决权限问题后成功恢复数据库；3)数据验证阶段，通过系统视图发现119个业务表，最终确认核心表包含743,016条记录。整个过程体现了系统性分析和严谨排错的重要性，展示了在信息不全情况下仍能成功恢复数据库的技术路径。

2025-06-11 17:15:02 895

原创 Ubuntu 离线安装 Docker 终极指南：一份包含实战排错的完整行动手册

在一个与互联网完全隔离（即“物理隔离”）的 Ubuntu 系统上部署 Docker，是一项对严谨性、预见性和知识储备要求极高的技术任务。本指南将提供一份全面的、分步式的“野战手册”，旨在指导您在完全离线的环境中成功安装 Docker。我们将一丝不苟地准备所有必要组件，执行战略性的安装部署，预见并高效地解决常见的冲突，最后用绝对可靠的方法验证我们的成功。现在，真正的 Docker 安装程序需要在此处放置自己的文件，从而导致了直接冲突。在组装我们的工具包之前，我们必须精确地了解目标环境的规格。

2025-06-10 15:31:37 596

原创 Jumpserver 本地化部署深度实践：从配置陷阱到环境污染的终极排错指南（错误代码详解版）

《Jumpserver本地部署实战：从官方文档到环境配置的深度排错指南》摘要本文针对Jumpserver开源堡垒机在本地部署过程中的常见问题，提供了一套系统性的解决方案。通过Ubuntu/Debian环境下的完整案例，文章揭示了官方文档未覆盖的三大类问题：环境依赖冲突（如Python包编译所需的系统库）、配置陷阱（包括SECRET_KEY缺失和Redis认证问题）以及深层环境污染（特别是conda与venv冲突）。重点剖析了lxml/xmlsec库版本不匹配等典型错误的技术原理，并给出了环境隔离、依赖分层

2025-06-10 13:54:58 1023

原创 PaddleSpeech 实战：开发与打包离线语音识别（ASR）命令行应用

《基于PaddleSpeech构建离线语音识别工具指南》摘要：本文详细介绍如何利用PaddleSpeech构建离线语音识别工具的全流程。首先通过Conda创建隔离环境并安装PaddleSpeech，验证单文件识别功能后，开发了批量处理脚本（支持递归处理子目录音频文件）。针对离线部署需求，使用PyInstaller将Python脚本和模型打包成独立可执行文件，重点解决了模型本地加载问题。最终工具可在无网络、无Python环境的服务器上运行，自动将指定目录及其子目录下的.wav文件转换为文本，输出同名.txt

2025-06-09 16:25:22 1875

qq_51828120的博客

原创 Whisper微调实战：从数据到语音识别

原创实战指南：构建支持语音对话的后端服务与数据持久化

原创新手指南：在 Ubuntu 上安装 PostgreSQL 并通过 VS Code 连接及操作

原创一次完整的 SQL Server 备份恢复与数据勘探之旅（实战复盘版）

原创 Ubuntu 离线安装 Docker 终极指南：一份包含实战排错的完整行动手册

原创 Jumpserver 本地化部署深度实践：从配置陷阱到环境污染的终极排错指南（错误代码详解版）

原创 PaddleSpeech 实战：开发与打包离线语音识别（ASR）命令行应用

原创【GeoLayoutLM】视觉信息提取（Visual Information Extraction, VIE）

原创基于YOLOv11的分类模型的大分类区分小分类细分

原创基于YOLOv11的语义分割模型训练自己的数据集

空空如也

空空如也