kaldi中文语音识别_基于thchs30(5)

最新推荐文章于 2021-01-12 11:34:08 发布

置顶

52Babara

最新推荐文章于 2021-01-12 11:34:08 发布

阅读量6.7k

点赞数 2

分类专栏：语音识别中文识别语音处理 ASR 音视频开发系统技术专题文章标签： ASR kaldi 中文识别语音识别

本文链接：https://blog.csdn.net/dqxiaoxiao/article/details/80336330

版权

接上回
if [ -f $data/segments ]; then #这里是查看data/mfcc/train下是否存在segments，如果存在则执行then后面的脚本，否则执行else后面的，
这个文件不存在，所以之后调用else后面的处理
echo "$0 [info]: segments file exists: using that."

split_segments=""
for n in $(seq $nj); do
split_segments="$split_segments $logdir/segments.$n"
done

utils/split_scp.pl $data/segments $split_segments || exit 1;
rm $logdir/.error 2>/dev/null

$cmd JOB=1:$nj $logdir/make_mfcc_${name}.JOB.log \
extract-segments scp,p:$scp $logdir/segments.JOB ark:- \| \
compute-mfcc-feats $vtln_opts --verbose=2 --config=$mfcc_config ark:- ark:- \| \
copy-feats --compress=$compress $write_num_frames_opt ark:- \
ark,scp:$mfccdir/raw_mfcc_$name.JOB.ark,$mfccdir/raw_mfcc_$name.JOB.scp \
|| exit 1;

else
echo "$0: [info]: no segments file exists: assuming wav.scp indexed by utterance." #打印make_mfcc.sh: [info]:没有段文件存在:假设wav.scp索引是通过说话者进行
split_scps=""
for n in $(seq $nj); do
split_scps="$split_scps $logdir/wav_${name}.$n.scp"
echo "----test: $split_scps"
done #这里应该是切分为4个，每一个都添加到这个变量中，我们注释后面的，加入一些打印运行一下

我们看到分为了四个
utils/split_scp.pl $scp $split_scps || exit 1; #这里就是将$scp(也就是 data/mfcc/train下的wav.scp)按照 $split_scps切分，也就是切分为上面说到的四个，我们后面在具体的看。我们执行一下这句。我们看到在exp/make_mfcc/train下生成4个文件。

可以用对比软件与原来的wav.scp对比一下。后来发现每个文件中是2500条目，一共是10000条目。

# add ,p to the input rspecifier so that we can just skip over
# utterances that have bad wave data. #加入,p

最低0.47元/天解锁文章

52Babara

关注

2
点赞
踩
11

收藏

觉得还不错? 一键收藏
3
评论
kaldi中文语音识别_基于thchs30(5)

接上回if [ -f $data/segments ]; then #这里是查看data/mfcc/train下是否存在segments，如果存在则执行then后面的脚本，否则执行else后面的，这个文件不存在，所以之后调用else后面的处理 echo "$0 [info]: segments file exists: using that." split_segments="" for...
复制链接

扫一扫