自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Whisper微调实战:从数据到语音识别

本项目提供了一个基于OpenAI Whisper模型的语音识别微调方案。主要流程包括:1) 数据准备,使用音频切割工具和doccano标注平台处理数据;2) 环境配置,基于conda安装79个依赖库;3) 模型训练,采用动态LoRA策略(根据训练步数自动选择标准LoRA或AdaLoRA);4) 模型验证,评估字符错误率等指标。项目针对中文优化,支持JSONL格式数据集,提供从数据预处理到模型验证的完整实施方案。关键创新点是训练参数动态调整机制,根据训练步数自动选择最优微调策略。

2025-08-20 17:52:24 342 1

原创 实战指南:构建支持语音对话的后端服务与数据持久化

本文详细介绍了水务行业智能客服系统后端服务的构建方案,重点包括三部分:1)采用PostgreSQL设计voice_logs表,通过会话ID串联对话记录;2)制定语音文件存储策略,采用时间戳+会话ID的命名规范;3)实现Python Flask服务代码,包括数据库连接、日志服务API接口及主控制器调用流程。系统采用微服务架构,确保数据安全性和可维护性,为智能客服应用提供可靠的后端支持。

2025-07-04 11:31:39 825

原创 新手指南:在 Ubuntu 上安装 PostgreSQL 并通过 VS Code 连接及操作

本文详细记录了在Ubuntu系统上安装PostgreSQL数据库、配置连接以及创建客服对话数据表的过程。作者从初学者角度出发,逐一解决了安装服务缺失、排序规则冲突、数据库连接错误、表创建失败等常见问题。通过终端命令和VSCode客户端配合,最终成功创建了包含客户输入/时间、机器人输出/时间等字段的conversations表,并完成数据插入和查询操作。本文为新手提供了可复现的PostgreSQL操作指南,展示了从安装到实际应用的完整流程,有助于理解数据库管理的基本原理。

2025-06-30 16:34:17 918

原创 一次完整的 SQL Server 备份恢复与数据勘探之旅(实战复盘版)

本文详细记录了从零开始处理未知SQL Server备份文件(.bak)的全过程。通过三个阶段展现了技术排错与数据发现的方法论:1)环境准备与连接阶段,克服SSL证书验证问题成功连接;2)备份文件勘探阶段,解决权限问题后成功恢复数据库;3)数据验证阶段,通过系统视图发现119个业务表,最终确认核心表包含743,016条记录。整个过程体现了系统性分析和严谨排错的重要性,展示了在信息不全情况下仍能成功恢复数据库的技术路径。

2025-06-11 17:15:02 895

原创 Ubuntu 离线安装 Docker 终极指南:一份包含实战排错的完整行动手册

在一个与互联网完全隔离(即“物理隔离”)的 Ubuntu 系统上部署 Docker,是一项对严谨性、预见性和知识储备要求极高的技术任务。本指南将提供一份全面的、分步式的“野战手册”,旨在指导您在完全离线的环境中成功安装 Docker。我们将一丝不苟地准备所有必要组件,执行战略性的安装部署,预见并高效地解决常见的冲突,最后用绝对可靠的方法验证我们的成功。现在,真正的 Docker 安装程序需要在此处放置自己的文件,从而导致了直接冲突。在组装我们的工具包之前,我们必须精确地了解目标环境的规格。

2025-06-10 15:31:37 596

原创 Jumpserver 本地化部署深度实践:从配置陷阱到环境污染的终极排错指南(错误代码详解版)

《Jumpserver本地部署实战:从官方文档到环境配置的深度排错指南》摘要 本文针对Jumpserver开源堡垒机在本地部署过程中的常见问题,提供了一套系统性的解决方案。通过Ubuntu/Debian环境下的完整案例,文章揭示了官方文档未覆盖的三大类问题:环境依赖冲突(如Python包编译所需的系统库)、配置陷阱(包括SECRET_KEY缺失和Redis认证问题)以及深层环境污染(特别是conda与venv冲突)。重点剖析了lxml/xmlsec库版本不匹配等典型错误的技术原理,并给出了环境隔离、依赖分层

2025-06-10 13:54:58 1023

原创 PaddleSpeech 实战:开发与打包离线语音识别(ASR)命令行应用

《基于PaddleSpeech构建离线语音识别工具指南》摘要: 本文详细介绍如何利用PaddleSpeech构建离线语音识别工具的全流程。首先通过Conda创建隔离环境并安装PaddleSpeech,验证单文件识别功能后,开发了批量处理脚本(支持递归处理子目录音频文件)。针对离线部署需求,使用PyInstaller将Python脚本和模型打包成独立可执行文件,重点解决了模型本地加载问题。最终工具可在无网络、无Python环境的服务器上运行,自动将指定目录及其子目录下的.wav文件转换为文本,输出同名.txt

2025-06-09 16:25:22 1875

原创 【GeoLayoutLM】视觉信息提取(Visual Information Extraction, VIE)

环境配置摘要文章介绍了 GeoLayoutLM—— 用于视觉信息提取(VIE)的多模态框架的官方 PyTorch 实现。该框架创新性地融入了几何预训练和专为关系提取(RE)设计的新型关系头,在序列标注(SER)任务中取得极具竞争力的成绩,在 RE 任务上显著超越了先前的最优方法。文章提供了预训练模型以及在 FUNSD 数据集上微调后的 SER 和 RE 模型的下载链接,同时指出视觉模块训练会导致最终性能不稳定。

2025-04-21 12:02:44 1551

原创 基于YOLOv11的分类模型的大分类区分小分类细分

首先进入官方下载官方代码。https://github.com/ultralytics/ultralytics​终端打开: code /home/tony/桌面/csdn/ultralytics-main安装yolov11环境: 下载官方的预训练模型放入代码目录下。 图像分类 -Ultralytics YOLO 文档​开始制作数据集:我在百度上查找了10张铅笔,10张钢笔,10张尺子,10张橡皮。其中钢笔和铅笔划分为笔类制作数据集。我们要修改数据集名称:大分类+小分类,比如:bi_gangbi数据集

2025-04-15 10:51:18 802

原创 基于YOLOv11的语义分割模型训练自己的数据集

基于yolov11的语义分割模型训练自己的数据集。

2025-04-14 14:50:12 1367 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除