一、ASR语音部分数据集收集
1. 下载录制音频的软件 (Audacity)
Ubuntu系统安装方法:sudo apt install audacity
windows系统安装方法:https://www.onlinedown.net/soft/46359.htm
2.利用 Audacity 制作音频
录制语音文件,文件类型需统一转换为wav格式,采样率建议在44100HZ 、单声道。
二、ASR语音部分数据集制作
数据清单格式要求:
audio_filepath:音频文件的路径
duration:音频文件的时长
text:音频文件的内容