![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音识别
cxxx17
为什么可乐一定要加冰
展开
-
MFCC特征提取过程
接下来详细写下语音提取MFCC特征的过程。提取MFCC的流程(以提取39维MFCC特征为例)如图所示。预加重:预加重的作用是提升高频。对于语音中发声的部分,比如元音,它的频谱中高频的能量在传播中有比较明显的衰减,因此采用预加重的方法对高频部分进行补偿。对于n时刻语音的采样值????[????],经过预加重处理后得到的输出:y[n]=x[n]−a∗x[n−1]y[n]=x[n] - a*x[n-1]y[n]=x[n]−a∗x[n−1]预加重系数????的取值一般在0.9到1之间。预加重相当于将信号通原创 2020-11-08 23:42:49 · 3677 阅读 · 4 评论 -
Deep Learning for Human Language Processing Introduction
@introduction最近在看李宏毅老师(Hung-YiLee)的Deep Learning for HumanLanguage Processing,整理了一些笔记。课程简介主要讲述人类语言处理中的深度学习方法。采用人类语言处理名词的原因是与自然语言处理区别开,因为自然语言处理往往仅仅考虑文本的数据形式。而这门课既包括了文本形式的语言处理,也包括了语音形式的语言处理。即人类与机器交互过程中,如何让机器听懂人的语音、看懂人的文字git clone https://github.com/kal原创 2020-07-02 23:11:52 · 172 阅读 · 0 评论 -
Transformer based ASR 环境配置
Transformer based ASR 环境配置环境配置1.anaconda下载安装2.建一个新的虚拟环境3.在虚拟环境中安装需要的包环境配置1.anaconda下载安装https://www.anaconda.com/2.建一个新的虚拟环境可以指定虚拟环境中的python版本conda create -n tf python=2.7.153.在虚拟环境中安装需要的包安装读取...原创 2019-12-21 22:50:11 · 381 阅读 · 0 评论