对TIMIT数据进行格式转换(windows解决报错wave.Error: file does not start with RIFF id)

对TIMIT数据进行格式转换(windows解决报错wave.Error: file does not start with RIFF id)

在语音识别中,常用的语音开源数据库TIMIT在python中进行训练前需要进行预处理,不然就会报错wave.Error: file does not start with RIFF id。本文介绍在windows中的处理过程如下:

如果没安装kaldi就先下载一个sph2pipe_v2.5,链接: http://www.openslr.org/3/。此处省略超简单的安装配置过程。然后在TIMIT文件中打开power shell运行命令——

forfiles /s /m *.wav /c "cmd /c sph2pipe -f wav @file @fnameRIFF.wav"

此代码搜索每个文件并使其可读取为python库。如果用的系统是Linux或者unix可参考stack overflow上的方法:链接: https://stackoverflow.com/questions/44748258/reading-a-wav-file-from-timit-database-in-python
之后打开文件夹还可能发现一堆RIFFRIFF重复命名的文件,大小为0kb,看其不顺眼遂将它们统统用以下方法删除(与上面的命令一样,都在TIMIT文件中打开power shell运行)——

forfiles /s /m *.wav /c "cmd /c if @fsize==0 del @file"

以上命令的运行时间都较长,耐心等等就好咯~

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值