SiSEC 2016 语音库

1、 test.zip

1) 内容

包含3种立体混合语音:

(1)     瞬间混叠(通过正增益缩放的静态源)

(2)     现场录音(在会议室用扬声器播放静态源,每一次用一对全向麦克风录一个源,再加一起形成混合源)

Ps:因为SiSEC2015,我们不再评估“合成的混合卷积混合语音”(通过Roomsim 工具箱模拟的一对全向麦克风合成的房间瞬间脉冲响应过滤静态源???)

(3)合成的混合卷积混合语音

    2)场景

合成的卷积混合语音和现场录音的房间的尺寸一致:4.45 x 3.55 x 2.5 m;混响时间T60=130ms/250ms;麦克风的距离为1m/5cm。共有9种混合条件。

源的到达方向在-60°到+60°之间变化,最小间距为15度,声源和麦克风对之间的距离在80cm和1.20m之间变化。【不是很懂,这的到达方向是只单个源的还是不同的源的相互夹角?】

    3)声源集

对于每个混合条件,通过放置在不同的空间位置的不同组声源生成六个混合语音:

         ①4个男声源

         ②4个女声源

         ③3个男声源

         ④3个女声源

         ⑤3个非撞击的音乐源

         ⑥3个包括鼓声在内的音乐声源

  4)命名说明

数据集包含了立体WAV音频文件,可以使用MATLAB的audioread()函数进行读取。文件命名均为:test___mix.wav,中间是声源集的缩写+混合类型的缩写+混响时间+麦克风距离。

  5)授权问题:这些文件根据知识共享署名 - 非商业性使用 - 相同方式授权2.0提供。

 

2、 test2.zip

1)内容

包含2种立体混合语音:

(1)     瞬间混叠(通过正增益和负增益缩放的静态源)

(2)     仿真录音(在真实的房间,使用一对全向麦克风录扬声器播放的经过脉冲响应的静态源)

2) 场景

仿真录音的房间4.45 x 3.55 x 2.5 m,声源与麦克风对的距离为1.2m。混响时间T60=130ms/380ms,麦克风距离为4cm/20cm。含瞬间混叠,共5种混合条件。

3) 声源集、命名说明、授权问题

同test1.

    

3、 test3.zip

1) 内容

含2种3通道混合语音(我暂时用不到,暂不翻译了)

4、 dev1.zip

1) 内容

Test1的开发数据

2) 命名说明

①   dev1____src_.wav:单通道声源信号

②   dev1__inst_matrix.mat:瞬时混叠的混合矩阵

③   dev1_____setup.txt:卷积混合语音的声源位置

④   dev1_____filt.mat:卷积混合语音的混合滤波器系统

⑤   dev1_____sim_.wav:声源对两通道混合语音的立体贡献(即混合语音的纯净源?)

⑥   dev1_____mix.wav:立体混合信号

5、 dev2.zip

同为test1的开发数据,说明一致。

6、 dev3.zip

1) 命名说明

①   dev3____src_.wav:单通道声源信号

②   dev3_____sim_.wav:声源对两通道混合语音的立体贡献(即混合语音的纯净源?)

③   dev3_____mix.wav:立体混合信号


根据点击打开链接翻译整理,侵权删。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值