![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Kaldi
jack_201316888
这个作者很懒,什么都没留下…
展开
-
Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是:1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell2.gale_mandarin: 中文新闻广播数据集(LDC2013S08, LDC2013S08)3.hkust: 中文电话数据集(LDC2005S15, LDC2005T32)4.thchs30: 清华大学30小时的数据集,可以在http://www.openslr.org/18/下载.转载 2020-08-21 19:00:58 · 1347 阅读 · 0 评论 -
语音识别工具Kaldi (二)
在上一篇blog中简单的介绍了Kaldi的安装方法有趣的开源软件:语音识别工具Kaldi (一)在这篇blog中继续Kaldi模型训练的步骤,介绍一下在模型训练之前的一些数据准备的工作。因为我也是正在学习语音识别和Kaldi,有些地方不一定说的很正确,如果发现错误,还请指正。在Kaldi源代码树中,有一个叫做egs的文件夹,在这个文件夹中保存着一些Kaldi在公共数据集上的训练步骤(shell脚本)以及测试的结果。其中,中文的语音识别公共数据集一共有三个,分别是gale_mandarin: 中文..转载 2020-08-21 18:19:10 · 504 阅读 · 0 评论 -
有趣的开源软件:语音识别工具Kaldi (一)
最新人工智能论文:http://paperreading.clubKaldi是一个非常强大的语音识别工具库,主要由Daniel Povey开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别的模型的训练和预测。其中DNN-HMM中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、LSTM以及Bidirectional-LSTM等神经网络结构均可支持。目前在Github上这个项目依旧非常活跃,可以在https://github.com/kaldi-asr/ka.转载 2020-08-21 18:06:36 · 562 阅读 · 0 评论 -
kaldi介绍
Kaldi 介绍Kaldi 是由 C++ 编写的语音识别工具,其目的在于为语音识别研究者提供一个研究和使用的平台。Kaldi 环境搭建本文主要通过使用 Docker 和 Nvidia-docker 构建 Ubuntu 环境对 Kaldi 进行搭建。Docker 针对的是无 GPU 的环境,Nvidia-docker 针对的是需要使用 GPU 计算的环境,如果读者机器上存在 GPU 计算资源,请使用 Nvidia-docker,使用 Nvidia 官方提供的 CUDA 镜像,可以省去安装 CUDA转载 2020-07-24 17:41:31 · 3201 阅读 · 0 评论 -
语音识别之kaldi
最近一直在折腾kaldi,在这个庞大的系统面前,自己是那么的微小。由于数据库的原因,我只能运行kaldi所给例子的一部分。下面就来说说最近的进展吧。第一个例子就是yesno这个例子。由于提供数据,而且数据比较小,可以非常容易的去实现这个例子。具体的可以见我之前的博客:语音识别工具箱之kaldi介绍。第二个例子是rm里面的s4。具体的步骤也很简单,首先运行./getdata.sh,然后运行run.sh。贴下最后的结果:exp/tri2a/decode/wer_1...转载 2020-06-29 09:01:53 · 251 阅读 · 0 评论