语音识别
373955482
If we can analysis it,we can optimize it
展开
-
HTK实现孤立词语音识别
使用HTK实现简单孤立词识别系统1.录音标注2.生成MFCC参数3.模型初始化4.生成语法词典5.训练6.识别原创 2017-02-08 17:31:08 · 1045 阅读 · 0 评论 -
HTK3.4.1在VS2013建立工程编译
在VS2013里编译调试HTK原创 2017-02-10 11:05:03 · 1069 阅读 · 0 评论 -
基于GMM-UBM的说话人识别 MSR Identity Toolkit
说话人识别MSR Identity Toolkit使用微软的声纹识别工具箱,记录使用步骤 该工具箱包含了常规的基于GMM-UBM方法以及state-of-the-art的基于i-vector方法,本文记录的是GMM-UBM方法,使用TIMIT语料库进行训练 先说明这个demo对训练语句的划分方式,总共630人共6300句话,530人共5300句话用来训练UBM,剩余100人共1000句话原创 2017-08-17 20:29:13 · 15807 阅读 · 29 评论 -
音频特征提取及差异
MFCC特征提取步骤: 预加重->STFT->mel滤波->DCT变换->倒谱提升 不同工具提取的特征会有差别,这里选用python中的librosa库分析 预加重: FIR一阶高通滤波器,提升高频分量,传递函数为 H(z)=1−a∗z−1H(z)=1−a∗z−1H(z) = 1-a*z{^-1}系数a一般取原创 2017-12-28 11:30:21 · 14931 阅读 · 7 评论 -
keras 双向LSTM
keras 双向LSTM双向LSTM利用到了未来的信息,在一些文本分类和序列预测问题上可以做到比单向LSTM更好的效果,BiLSTM与LSTM相比,多了一个反向计算,同时利用正向方向的数据计算最终输出,关于LSTM的前向计算可以看这里这里就只简单记录下keras 的BiLSTM参数个数计算,训练部分如下:model = Sequential()input_shape = (149...原创 2018-04-25 10:06:12 · 13140 阅读 · 4 评论