TIMIT数据集预处理（使用python）

最新推荐文章于 2023-02-23 13:36:10 发布

weixin_44755003

最新推荐文章于 2023-02-23 13:36:10 发布

阅读量1.2k

点赞数 3

分类专栏：学习路程文章标签：深度学习 python

本文链接：https://blog.csdn.net/weixin_44755003/article/details/110262940

版权

本文介绍了在复现深度学习论文过程中，由于wjs0数据集收费，选择使用TIMIT数据集作为替代。在处理TIMIT数据集时，面临将SPH格式文件转换为WAV格式的问题。作者分享了一个简洁的Python解决方案，以便于其他人参考和记录。

摘要由CSDN通过智能技术生成

语音分离

TIMIT数据集

在复现论文的时候发现wjs0数据集收费，因为组内没有这个数据集，所以用TIMIT数据集替代，在使用TIMIT数据集时遇到一个需要将原有数据集中SPH格式（原来数据集的.WAV格式并非真正的wav格式，而是sph格式）的文件转化为WAV格式。搜索了一大圈的解决方法，虽然自己已经解决，但是在国外论坛中发现一个比较简洁的解决方式，遂将其贴出来，记录一下。

代码

import params as hp
from sphfile import SPHFile
import glob
import os
 
if __name__ == "__main__":
    path = 'D:/pycharm_proj/corpus/data/lisa/data/timit/raw/TIMIT/TRAIN/*/*/*.WAV

最低0.47元/天解锁文章

weixin_44755003

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
2
评论
TIMIT数据集预处理（使用python）

语音分离TIMINT数据集在复现论文的时候发现wjs0数据集收费，因为组内没有这个数据集，所以用TIMIN数据集替代，在使用TIMIT数据集时遇到一个需要将原有数据集中SPH格式（原来数据集的.WAV格式并非真正的wav格式，而是sph格式）的文件转化为WAV格式。搜索了一大圈的解决方法，虽然自己已经解决，但是在国外论坛中发现一个比较简洁的解决方式，遂将其贴出来，记录一下。代码import params as hpfrom sphfile import SPHFileimport globim
复制链接

扫一扫