语音识别
文章平均质量分 56
落红灬有丶情
nice to meet you~
展开
-
语音识别中的词错率(SER)以及字错率(WER)
1.句错率句错率(Sentenct Error Rate,SER):如果识别的句子与标准句子中由任意一个字不对应,那么这句话就是错的,错的句子个数除以总句子个数即为句错率。公式如下: 可以理解为以下情况:描述 例子 由于字多而导致句子不对 如:吃了吗?识别为:吃了吗妈? 由于字少而导致句子不对 如:吃了吗...原创 2019-11-13 09:38:15 · 3966 阅读 · 1 评论 -
基于kaldi的在线语音识别
本文是基于kaldi的在线语音识别,使用b/s架构进行在线识别。适用于刚刚接触的小白。开发环境:jdk-1.8,Ubuntu16.04,Eclipse。开发过程:1.准备必须的文件 如果你想要实现在线语音识别功能在kaldi下,那么你需要有训练好的“final.mdl”(final.mdl其实是最后模型链接过来的,是最后的模型“数字.mdl”,如果你发现你复制不过来“...原创 2017-12-18 09:58:12 · 5087 阅读 · 12 评论 -
语音识别之语料准备
首先要制定好音频的格式,比如:Mono(单声道),16000hz(采样率),音频格式为wav。接着,录音的时候一定要慢!不要太快,如果太快的话识别率会很低。文本中的字符一定要确定好是utf-8的编码,不然之后会出各种错误。...原创 2018-07-18 16:22:25 · 2763 阅读 · 0 评论 -
dnn+i-vector在kaldi中的实现。
需要三行脚本,你可以一行做一个脚本文件,这样就不需要每次提取特征都要重新训练1步骤和2步骤的模型了。1:steps/online/nnet2/train_diag_ubm.sh --cmd "$train_cmd" data/train 1024 exp/tri3exp/diag_ubm#tri3是你训练的三音素模型所在的文件夹2:steps/online/nnet2/train_i...原创 2020-08-11 15:57:02 · 513 阅读 · 1 评论 -
kaldi、kaldi-ctc的安装(CUDA+CUDNN)
操作系统:Ubuntu14.04(64位)显卡:GTX750TiCUDA版本:7.5(后缀为cuda_7.5.18_linux.run)(截止2019-3-1,kaldi仅支持cuda7.5和cuda8.0)CUDNN版本:5.1(cudnn-7.5-linux-x64-v5.1.tgz)(截止2019-3-1,kaldi仅支持cudnn5.1)Nvidia显卡驱动:NVIDIA-...原创 2017-09-24 21:46:23 · 3505 阅读 · 4 评论