语音数据集汇总

Li Kang

已于 2023-12-10 07:53:45 修改

阅读量9.3k

点赞数 17

分类专栏：语音信号处理语音识别文章标签：人工智能机器学习

于 2020-03-17 20:52:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/s09094031/article/details/104919787

版权

语音信号处理同时被 2 个专栏收录

9 篇文章

订阅专栏

4 篇文章

订阅专栏

1. 噪声集

The QUT-NOISE dataset，来自昆士兰科技大学（QUT）的噪声数据集，其中包括了Café，Car，Home，Reverb，Street，五种场景，每种场景下又分了两个小场景，一共十个场景，约12小时数据，其中reverbe_pool 感觉不常见，训练时可以考虑删除。
Environmental Background Noise dataset，来自UTDallas的噪声数据集，包括三个场景，Babble，Car，Machinery，数据约30秒一条，一共253条。
MUSAN corpus 来自David Snyder and Guoguo Chen and Daniel Povey，里面有三个文件夹，分别是music，speech 和 noise。noise分类下有两个文件夹，数据长短不一，包含了各种生活场景，扩展噪声集的丰富性，930条。
Nonspeech dataset 来自Ohio State University，数据长短不一，包括各种生活场景，扩展噪声集的丰富性，一共100条。
microsoft/DNS-Challenge
ETSI 降噪能力数据集

2. 语音集

ETSI 语音质量数据集

博客等级

码龄16年

40
原创

416
点赞

1794
收藏

279
粉丝

关注

私信

热门文章

分类专栏

最新评论

MiniDSP车载声学之二：车载音频调试，DSP模块（Car Audio Tuning: DSP Modules and Their Use）
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)提升标题与正文的相关性。
麦克风阵列算法笔记之二（固定波束形成）
tyf0425: 请教下楼主，导向矢量维度中的ndegree是theta的个数吗，F(w)事先约定好的期望角度是指这个theta吗？设计波束的方向就是设计F(w)，来增强theta方向的信号？
一文读懂滤波器的线性相位，全通滤波器，群延迟
Li Kang: 4. 对于过渡带和截止频率要求极高的场景，比如重采样，一般使用FIR。
一文读懂滤波器的线性相位，全通滤波器，群延迟
Li Kang: 1. 实时性的要求。如果是离线处理，计算量也足够，就用FIR。如果是实时音频信号处理，要考虑FIR带来的延迟是否能接受。因为2阶的IIR的幅频特性可能相当于20阶的FIR。 2. 声源数量的影响。本文最后举例说明的音乐会是多个声源，之间有明显的相位关系，IIR对相位的改变容易被察觉。但如果你拿到的是单声道声源，IIR带来的相位改变，几乎不会被人耳察觉，所以大胆用IIR没关系。 3. 即便使用FIR，也不一定能保证线性相位。详见https://blog.csdn.net/s09094031/article/details/134175482?fromshare=blogdetail&sharetype=blogdetail&sharerId=134175482&sharerefer=PC&sharesource=s09094031&sharefrom=from_link
一文读懂滤波器的线性相位，全通滤波器，群延迟
csdnqixiaoxin: 博主，那什么场合下使用非线性相位的iir滤波器呢？既然非线性相位会造成失真，那就是说这些场合允许失真？失真程度多大呢？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。