下载得到的TIMIT数据集为虽然后缀为WAV,但是其实际是sphere格式,不能直接打开使用
在这里使用python实现转换,得到的音频可直接打开。
from sphfile import SPHFile
import glob
import os
# 将TIMIT语料库转换为wav格式
# 下载好的TIMIT语料库,不能直接读取和打开因为它是sphere格式
# 要转换成wav格式才能读取和打开,下面就是转化的代码
if __name__ == "__main__":
# TIMIT文件的路径 注意 r
path = r'D:\111AA\SX194.WAV'
# 多条语音转换
# path = r'D:\1AADNN\DNN - IRM\TIMIT\TEST\*\*\*.WAV'
sph_files = glob.glob(path)
print(sph_files)
print(len(sph_files), "个语音")
for i in sph_files:
sph = SPHFile(i)
sph.write_wav(filename=i.replace(".WAV", "a.wav"))
# 改名字,直接适用WAV到wav,不改名字,不成功
#os.remove(i) # 转换后,删除原始的语音文件
print("处理完成!")
参考大哥的博客:
Timit 数据集中音频无法播放,使用python进行格式转换[附Timit 百度网盘下载地址]_ASR_THU的博客-CSDN博客