
ASR
文章平均质量分 95
CSPhD-winston-杨帆
合作:winstonyf@qq.com 暨大博士生 川师大研究生 前成都东软教师
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Paraformer分角色语音识别-中文-通用 FunASR demo测试与训练
FunASR分角色语音识别模型测试摘要 本文介绍了如何使用FunASR框架中的Paraformer中文通用语音识别模型进行分角色语音识别测试。首先通过ModelScope下载预训练模型,然后使用Python脚本加载模型并测试音频识别效果。测试音频是一段包含对话的教学场景录音,识别结果准确展现了语音内容的时间分段和文本转写效果。模型支持语音活动检测(VAD)、标点恢复(PUNC)和说话人识别(SPK)等功能的灵活配置。文章提供了详细的安装步骤和代码示例,包括ffmpeg安装、模型下载方法以及识别测试脚本。测试原创 2025-06-04 22:38:49 · 1246 阅读 · 1 评论 -
ASR(语音识别)语音/字幕标注 通过via(via_subtitle_annotator)
摘要:本文介绍了VIA工具在语音/字幕标注中的使用方法,包括视频加载、时间片段添加(快捷键A)、字幕内容填写以及JSON文件保存等操作步骤。同时详细列出了VIA的键盘快捷键,涵盖常规操作(如播放控制、时间移动)、时间片段编辑(如删除、合并)和空间区域处理(如选择、删除区域)等功能,帮助用户高效完成多媒体标注任务。关键操作包括空格键播放、Shift调整片段边界、Ctrl精确移动时间片段等。原创 2025-06-09 12:55:19 · 1321 阅读 · 0 评论