语音
jack_201316888
这个作者很懒,什么都没留下…
展开
-
语音识别——MFCC理解
语音识别——MFCC理解要看懂这篇文章要把数字信号处理学懂在任意一个Automatic speech recognition 系统中,第一步就是提取特征。换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊,情绪啊等等。搞清语音是怎么产生的对于我们理解语音有很大帮助。人通过声道产生声音,声道的shape(形状?)决定了发出怎样的声音。声道的shape包括舌头,牙齿等。如果我们可以准确的知道这个形状,那么我们就可以对产生的音素phoneme进行转载 2020-12-08 09:50:31 · 1348 阅读 · 0 评论 -
kaldi介绍
Kaldi 介绍Kaldi 是由 C++ 编写的语音识别工具,其目的在于为语音识别研究者提供一个研究和使用的平台。Kaldi 环境搭建本文主要通过使用 Docker 和 Nvidia-docker 构建 Ubuntu 环境对 Kaldi 进行搭建。Docker 针对的是无 GPU 的环境,Nvidia-docker 针对的是需要使用 GPU 计算的环境,如果读者机器上存在 GPU 计算资源,请使用 Nvidia-docker,使用 Nvidia 官方提供的 CUDA 镜像,可以省去安装 CUDA转载 2020-07-24 17:41:31 · 3259 阅读 · 0 评论 -
语音识别之声学模型
https://blog.csdn.net/wja8a45TJ1Xa/article/details/78712930转载 2020-06-29 16:53:44 · 379 阅读 · 0 评论 -
语音识别之kaldi
最近一直在折腾kaldi,在这个庞大的系统面前,自己是那么的微小。由于数据库的原因,我只能运行kaldi所给例子的一部分。下面就来说说最近的进展吧。第一个例子就是yesno这个例子。由于提供数据,而且数据比较小,可以非常容易的去实现这个例子。具体的可以见我之前的博客:语音识别工具箱之kaldi介绍。第二个例子是rm里面的s4。具体的步骤也很简单,首先运行./getdata.sh,然后运行run.sh。贴下最后的结果:exp/tri2a/decode/wer_1...转载 2020-06-29 09:01:53 · 262 阅读 · 0 评论