kaldi在java中运行_kaldi实例脚本运行

最新推荐文章于 2021-03-16 11:36:33 发布

夙砂酒

最新推荐文章于 2021-03-16 11:36:33 发布

阅读量399

点赞数

文章标签： kaldi在java中运行

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_32758601/article/details/114505491

版权

本文详细介绍了如何在Java环境中运行Kaldi语音识别工具。首先，讲解了环境准备，包括设置训练和解码命令。接着，数据预处理部分，创建训练集和测试集，并展示了相关文件结构。然后，构建语言文件，使用`utils/prepare_lang.sh`生成FST语言描述。接下来，进行特征提取和单音素训练，展示了训练过程和对齐信息。最后，讨论了如何进行解码测试和查看解码结果。整个过程涵盖了Kaldi在Java环境中的基本运行流程。

摘要由CSDN通过智能技术生成

Getting started, and prerequisites.

rm/s5/run.sh

Data preparation

如果有GridEngine,

train_cmd="queue.pl -q all.q@a*.clsp.jhu.edu"

decode_cmd="queue.pl -q all.q@[ah]*.clsp.jhu.edu"

如果需要在本地运行

train_cmd="run.pl"

decode_cmd="run.pl"

创建训练集和测试集

local/rm_data_prep.sh /export/corpora5/LDC/LDC93S3A/rm_comp

生成如下：

local : Contains the dictionary for the current data. 包含当前数据的发音词典

train : The data segmented from the corpora for training purposes. 训练数据的seg标注信息

test_* : The data segmented from the corpora for testing purposes. 测试数据的seg标注信息

cd local/dict

head lexicon.txt

head nonsilence_phones.txt

head silence_phones.txt

/train和/test结构相同

head text

head spk2gender.map

head spk2utt

head utt2spk

head wav.scp

wc train/text test_feb89/text 比较训练集和测试集的词数，文件大小

下一步创建原始的语言文件

utils/prepare_lang.sh data/local/dict '!SIL' data/local/lang data/lang

这将会产生一个lang的文件夹，里面包含一个FST描述语言文件，输出文件夹(data/lang).

words.txt and phones.txt(data/lang/)被会用到，它们是openfst格式的符号表，代表从一个字符串到整数

的映射，

suffix .csl (in data/lang/phones) non-silence, and silence, phones 整数id键值对列表

phones.txt (in data/lang/) 音素符号表，处理FST的歧义符号，这

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kaldi在java中运行_kaldi实例脚本运行

Getting started, and prerequisites.rm/s5/run.shData preparation如果有GridEngine,train_cmd="queue.pl -q all.q@a*.clsp.jhu.edu"decode_cmd="queue.pl -q all.q@[ah]*.clsp.jhu.edu"如果需要在本地运行train_cmd="run.pl"de...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。