![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
speech
落地生根1314
这个作者很懒,什么都没留下…
展开
-
转:Python处理音频信号实战 : 手把手教你实现音乐流派分类和特征提取
参考链接: https://www.jiqizhixin.com/articles/2019-01-11-25 1986年出版的《音乐心理学》一书中说到“人类和音乐遵循共同的规律”。研究发现,人类大脑的生理信号具有带直线区域的线性规律,在生理上具有普遍性,产生公式:S(f) 1 / f ɑ。二十世纪八十年代,有专家研究巴赫《第一勃兰登堡协奏曲》的音乐信号时发现,音乐信号的功率谱与人类大脑生理信号的...转载 2019-03-05 15:32:17 · 8722 阅读 · 0 评论 -
STFT和声谱图,梅尔频谱(Mel Bank Features)与梅尔倒谱(MFCCs)
参考链接: https://blog.csdn.net/qq_28006327/article/details/59129110 最近小编在做ASC(Acoustic Scene Classification)问题,不管是用传统的GMM模型,还是用机器学习中的SVM或神经网络模型,提取声音特征都是第一步。梅尔频谱和梅尔倒谱就是使用非常广泛的声音特征形式,小编与它们斗争...转载 2019-03-06 10:39:21 · 2236 阅读 · 0 评论 -
转:语音信号预处理及特征参数提取
参考链接: https://zhuanlan.zhihu.com/p/26680599 1. WAVE文件格式在进行语音信号处理时,基本上会采用WAVE文件进行处理。WAVE文件格式有什么特点呢?为什么要使用WAVE文件呢?1.1 资源互换文件格式——RIFF在windows环境下,大部分的多媒体文件都依循着一些通用的结构来存放,这些结构称为“资源互换文件格式”(Resources Interch...转载 2019-03-10 15:43:17 · 2164 阅读 · 0 评论 -
转发:书单 | 语音研究进阶指南
参考链接: https://www.msra.cn/zh-cn/news/features/book-recommendation-speech 书单 | 语音研究进阶指南 2019-03-22 | 作者:汪曦 我们邀请了微软(亚洲)互联网工程院资深语音科学家汪曦为大家推荐语音领域的经典书目,涵盖了语音研究中的信号处理、语音和...转载 2019-05-17 10:01:41 · 277 阅读 · 0 评论 -
论文:Keyword Spotting Based On CTC and RNN For Mandarin Chinese Speech
Keyword Spotting Based On CTC and RNN For Mandarin Chinese Speech 摘要: 基于隐马尔可夫模型(HMM)和神经网络(NN)的混合模型是当前关键字识别(KWS)系统声学建模的前沿。然而,由于中间语音表示的依赖性,如何有效地训练这样一个混合系统是一个挑战。在端到端语音识别系统的驱动下,提出了一种利用端到端方法直接预测语音单元后验的普通话K...原创 2019-07-04 21:40:26 · 1876 阅读 · 0 评论 -
转:关于ROC曲线的理解
参考链接: https://www.cnblogs.com/dlml/p/4403482.html 机器学习之分类器性能指标之ROC曲线、AUC值 分类器性能指标之ROC曲线、AUC值 一 roc曲线 1、roc曲线:接收者操作特征(receiveroperating characteristic),roc曲线上每个点反映着对同一信号刺激的感受性。 横轴:负正类率(false ...转载 2019-07-27 10:09:19 · 10235 阅读 · 0 评论