语音分离
TIMIT数据集
在复现论文的时候发现wjs0数据集收费,因为组内没有这个数据集,所以用TIMIT数据集替代,在使用TIMIT数据集时遇到一个需要将原有数据集中SPH格式(原来数据集的.WAV格式并非真正的wav格式,而是sph格式)的文件转化为WAV格式。搜索了一大圈的解决方法,虽然自己已经解决,但是在国外论坛中发现一个比较简洁的解决方式,遂将其贴出来,记录一下。
代码
import params as hp
from sphfile import SPHFile
import glob
import os
if __name__ == "__main__":
path = 'D:/pycharm_proj/corpus/data/lisa/data/timit/raw/TIMIT/TRAIN/*/*/*.WAV