语音设别~~Kaldi
一尘在心
这个作者很懒,什么都没留下…
展开
-
Kaldi运行thchs30(清华大学中文语料库)
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是:1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell2.gale_mandarin: 中文新闻广播数据集(LDC2013S08, LDC2013S08)3.hkust: 中文电话数据集(LDC2005S15, LDC2005T32)4.t...翻译 2019-03-29 15:48:40 · 1977 阅读 · 1 评论 -
kaldi 在线中文识别系统搭建
https://blog.csdn.net/shichaog/article/details/73655628转载 2019-05-05 08:56:21 · 2012 阅读 · 1 评论 -
基于kaldi和CVTE开源模型的中文识别
https://blog.csdn.net/tcx1992/article/details/85717100转载 2019-05-05 08:46:30 · 582 阅读 · 0 评论 -
kaldi运行cvte开源chain模型
https://blog.csdn.net/baidu_26788951/article/details/83311145转载 2019-05-05 08:38:15 · 654 阅读 · 0 评论 -
Kaldi 使用 DFSMN 训练语音模型
阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。本场 Chat 的主要内容包括:语音识别流程简介 Kaldi 的部署使用 如何训练基于中文的 DFSMN 声学模型 语音...转载 2019-04-02 18:05:49 · 13689 阅读 · 15 评论 -
基于kaldi和CVTE开源模型的中文识别
基于kaldi和CVTE开源模型的中文识别1.Kaldi安装2.运行cvte模型3. 在CVTE上运行自己的数据4. CVTE 中调用的一些脚本解析特征处理部分:decode部分环境要求:ubuntu16.041.Kaldi安装Kaldi是一款基于c++编写的完全开源的语音识别工具箱。支持主流的特征提取:MFCC PLP等支持传统的GMM-HMM的声学模型构建支持WF...转载 2019-04-02 18:02:08 · 1666 阅读 · 0 评论 -
kaldi运行cvte开源chain模型
运行cvte模型模型下载地址:http://kaldi-asr.org/models/0002_cvte_chain_model.tar.gz解压放到kaldi-trunk/egs下即可在线识别命令(cd src/online2bin/):./online2-wav-nnet3-latgen-faster --do-endpointing=false --online=false --...转载 2019-04-11 10:49:20 · 824 阅读 · 0 评论 -
Centos7 安装 Kaldi 亲测有效
简介:Kaldi不是一款语音识别系统,而是一款建立语音识别系统的系统。Kaldi是一个开源的语音识别工具,整合了HTK的基本功能,同时也加入了深度神经网络的分类器(DNN)。可实现与文本无关的LVCSR系统,基于FST的训练与解码,支持多种标准的机器学习训练模型。Kaldi相关文档可参考官网:http://www.kaldi-asr.org/Kaldi内核采用c++语言编写,易于修...原创 2019-03-27 17:19:15 · 2773 阅读 · 0 评论 -
kaldi简介
最近准备开始进行语音识别算法的学习,所以决定拿kaldi进行解读,这样一方面更加增加自己C++的基本功,另一方面也可以让自己慢慢走入语音识别的大门,自己的路,决定了就走下去,不管有多难。首先我决定从kaldi的官网入手,不多说进入主题。kaldi是什么kaldi是使用c++写的语音识别的工具,apache 授予了v2.0的证书(果真应验,apache旗下无弱将)。kaldi旨在供语音识别...转载 2019-03-27 16:56:55 · 19477 阅读 · 1 评论 -
kaldi中的深度神经网络
这个文档主要来说kaldi中Karel Vesely部分的深度神经网络代码。如果想了解kaldi的全部深度神经网络代码,请Deep Neural Networks in Kaldi, 和Dan的版本, 请看Dan’s DNN implementation。这个文档的目标就是更加详细的介绍DNN部分,和简单介绍神经网络训练工具。我们将从Top-level script开始, 解释the...转载 2019-03-29 17:21:27 · 1513 阅读 · 1 评论 -
Kaldi中的nnet3之数据类型
简介本章涵盖了最新的nnet3。为了了解Kaldi里所有的DNN,例如例如karel的版本,参考Deep Neural Networks in Kaldi。nnet3的创建是为了以更自然的方式不需要实际编码就支持更多通用种类的网络,而不仅仅是反馈网络(例如RNN和LSTM)。和nnet2一样支持多机器多GPU并行(利用基于naturalgradient-stabilized SGD wi...转载 2019-03-29 17:19:37 · 1791 阅读 · 0 评论 -
Kaldi 使用CVTE训练好的SR模型做中文在线识别
关于Kaldi的下载与编译请参考:http://blog.csdn.net/snowdroptulip/article/details/78896915CVTE公司开源其训练好的TDNN模型,我们可以使用该模型来进行在线识别。一、下载首先从http://kaldi-asr.org/models.html下载模型;二、解压把下载好的模型解压到egs下面,egs/cvte三、运...转载 2019-03-29 15:51:15 · 1033 阅读 · 0 评论 -
thchs30中文在线识别
在前面的笔记中,我们已经训练出thchs30模型。这篇文章主要介绍如何用训练好的模型识别我们自己的语音。一、安装portaudio首先我们cd到tools下面,执行:./install_portaudio.sh然后在cd到src下面,执行:make ext二、创建相关文件从voxforge把online_demo拷贝到thchs30下,和s5同级,online_demo建o...转载 2019-03-29 15:50:40 · 847 阅读 · 0 评论 -
运用kaldi工具箱做一个baseline
https://www.zhihu.com/question/57230747?from=profile_question_card转载 2019-04-25 09:22:27 · 341 阅读 · 0 评论