![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
语音信号处理
twj625593616
这个作者很懒,什么都没留下…
展开
-
理解-MFCC梅尔倒谱系数
MFCC梅尔倒谱系数是说话人识别、语音识别中最为常用的特征。我曾经对这个特征困惑了很久,包括为什么步骤中要取对数,为什么要最后一步要做DCT等等,以下将把我的理解记录下来,我找到的参考文献中最有价值的要数【1】了。是CUM一个教授做的PPT。 整个流程如下: 时域的波形图如下 图1. 时域波形图 第一步 获得语谱图,语谱图是一个非常转载 2017-12-20 18:02:54 · 2650 阅读 · 1 评论 -
tensorflow训练神经网络-提取MFCC特征
https://my.oschina.net/zzw922cn/blog/544398 这里原作者给出了怎么提取MFCC及其一阶二阶系数,代码也非常详细。 但是目前已经有python_speech_features这个模块了, 可以 pip install python_speech_features 安装 这个模块下面有mfcc,delta等特征提取方便了很多哦原创 2017-12-20 18:08:19 · 4669 阅读 · 3 评论 -
shuffle函数打乱(images, labels)
当提取得到相应的文件(特征)及其标签后,我们需要将他们打乱顺序。 尝试了两种方法 一: 当每个例子的标签为一个多维向量时 例(1,0,0)时 采用以下方法 image_list = wav # 或者 image_list = np.arrary(wav) label_list = label # 或者 label_list = np.arrary(label) labeled_examp原创 2017-12-22 16:55:24 · 1796 阅读 · 0 评论