语音
文章平均质量分 82
语音相关知识
GaryGao99
这个作者很懒,什么都没留下…
展开
-
对齐工具MFA
MFA(Montreal Forced Aligner)是一种forced alignment工具。MFA底层是使用了kaldi工具,相对于其它的工具MFA使用triphone acoustic model来建模上下文信息,同时包含了和说话人相关的特征,因此可以适应不同的说话人。MFA具有可训练性 (trainability) ,即可由用户自己在新数据上训练acoustic model。...原创 2022-06-06 11:49:48 · 2855 阅读 · 1 评论 -
声纹识别中pooling总结
1、2、static pooinghttps://www.danielpovey.com/files/2018_icassp_xvectors.pdf3、attativce pooling4、原创 2021-06-08 19:00:28 · 1718 阅读 · 0 评论 -
离散傅里叶变化的直观理解
An Intuitive Discrete Fourier Transform Tutorialhttp://practicalcryptography.com/miscellaneous/machine-learning/intuitive-guide-discrete-fourier-transform/翻译 2020-10-19 17:28:16 · 1469 阅读 · 0 评论 -
语音特征提取
目录Setup预加重(Pre-Emphasis)分帧(Framing)加窗(Window)傅里叶变换和功率谱(Fourier-Transform and Power Spectrum)Filter Banks梅尔倒谱系数 Mel-frequency Cepstral Coefficients (MFCCs)均值归一化 Mean Normalization...翻译 2020-02-29 11:15:18 · 3380 阅读 · 5 评论