Kaldi 提取MFCC40维的参数设置

最新推荐文章于 2021-06-29 15:18:25 发布

小狮子要炸boom

最新推荐文章于 2021-06-29 15:18:25 发布

阅读量1k

点赞数

分类专栏：语音识别文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dreamy_z/article/details/107862932

版权

语音识别专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1. 数据准备：wave文件，，获取wav.scp，spk2utt，utt2spk三个文件

find /*/16kwav -name '*.wav' | awk -F '/' '{print $NF " " $0}' > ./data/wav.scp

find /*/16kwav -name '*.wav' | awk -F '/' '{print $NF " " $NF}' > ./data/spk2utt

find /*/16kwav -name '*.wav' | awk -F '/' '{print $NF " " $NF}' > ./data/utt2spk

2. 特征提取

首先需要更改conf/mfcc.conf文件参数，更改如下：

# config for high-resolution MFCC features, intended for neural network training.

# Note: we keep all cepstra, so it has the same info as filterbank features,

# but MFCC is more easily compressible (because less correlated) which is why

# we prefer this method.

--use-energy=false # use average of log energy, not energy.

--sample-frequency=16000 # AISHELL-2 is sampled at 16kHz

--num-mel-bins=40 # similar to Google's setup.

--num-ceps=40 # there is no dimensionality reduction.

--low-freq=20 # low cutoff frequency for mel bins

--high-freq=-400 # high cutoff frequency, relative to Nyquist of 8000 (=7600)

接下来运行如下命令：

utils/fix_data_dir.sh /*/data

./steps/make_mfcc.sh /*/data ./ts_log /*/data/mfcc

小狮子要炸boom

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Kaldi 提取MFCC40维的参数设置

1. 数据准备：wave文件，，获取wav.scp，spk2utt，utt2spk三个文件find /*/16kwav -name '*.wav' | awk -F '/' '{print $NF " " $0}' > ./data/wav.scp find /*/16kwav -name '*.wav' | awk -F '/' '{print $NF " " $NF}' > ./data/spk2utt find /*/16kwav -name '*.wav' |
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。