TIMIT数据集预处理(使用python)

语音分离

TIMIT数据集

在复现论文的时候发现wjs0数据集收费,因为组内没有这个数据集,所以用TIMIT数据集替代,在使用TIMIT数据集时遇到一个需要将原有数据集中SPH格式(原来数据集的.WAV格式并非真正的wav格式,而是sph格式)的文件转化为WAV格式。搜索了一大圈的解决方法,虽然自己已经解决,但是在国外论坛中发现一个比较简洁的解决方式,遂将其贴出来,记录一下。

代码

import params as hp
from sphfile import SPHFile
import glob
import os
 
if __name__ == "__main__":
    path = 'D:/pycharm_proj/corpus/data/lisa/data/timit/raw/TIMIT/TRAIN/*/*/*.WAV
  • 3
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
This corpus contains a selection from the TIMIT Acoustic-Phonetic Continuous Speech Corpus, consisting of speech files, annotations,and associated materials: * 16 speakers from 8 dialect regions * 1 male and 1 female from each dialect region * total 130 sentences (10 sentences per speaker; note that some sentences are shared among other speakers, sa1 and sa2 are spoken by all speakers.) * total 160 sentence recordings (10 recordings per speaker) * audio format: wav format, single channel, 16kHz sampling, 16 bit sample, PCM encoding 数据相关论文: 使用数据的论文: 暂无信息 来自万方数据的相关论文: 期刊论文 基于学习者英语语料的类联接研究概念、方法及例析 - 外语电化教学 - 2009(3) 期刊论文 基于HTK的连续语音识别系统及其在TIMIT上的实验 - 现代计算机(专业版) - 2009(11) 会议论文 Iterative Language Model Adaptation for Large Vocabulary Continuous Speech Recognition - 2011 4th IEEE International Conference on Computer Science and Information Technology(ICCSIT 2011)(2011年第四届IEEE计算机科学与信息技术国际会议) - 2011 会议论文 The Fixed-Point Optimization of Mel Frequency Cepstrum Coefficients for Speech Recognition - The 6th International Forum on Strategic Technology(IFOST 2011)(第六届国际战略技术论坛) - 2011 会议论文 语音编码对说话人识别系统的影响 - 第二届和谐人机环境联合(第15届全国多媒体技术、第2届全国人机交互、第2届全国普适计算)学术会议 - 2006 期刊论文 车载环境下基于样本熵的语音端点检测方法 - 计算机研究与发展 - 2011, 48(3) 会议论文 A Corpus-based Comparative Study of Company Profiles --A Case Study Between World Top-500 and Zhejiang Top-100 - 2010 Summit International Marketing Science and Management Technology Conference(2010年国际营销科学与管理技术大会) - 2010 期刊论文 留学生汉语中介语语料库建设若干问题探讨——以中山大学汉字偏误中介语语料库为例 - 语言文字应用 - 2012(2) 会议论文 A NON-FIXED-LENGTH SEQUENCES CLUSTERING APPROACH FOR SPEECH CORPUS REDUCTION - 2007 International Conference on Machine Learning and Cybernetics(IEEE第六届机器学习与控制论国际会议) - 2007 期刊论文 联想学习记忆的脑功能磁共振成像 - 中华神经科杂志 - 2008, 41(4)

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值