![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
kaldi
文章平均质量分 75
ai-ai360
数据挖掘,自然语言处理,推荐,搜索,语音识别,语音处理相关学习知识笔记
展开
-
语音识别训练和解码——声学特征与文本标记如何对齐
语音识别,输入是声学特征的序列,上图中X是经过一定规则提取的39维mfcc向量组成的矩阵,矩阵大小是不固定的,因为输入语音长度不一样,提取的语音帧就不一样,比如有10039,100039, 一般按照25ms一帧,10ms一个帧移,所以一秒中语音有100帧。由于人说话字数不固定的,所以一句话说完时长不一样,这样得到帧矩阵大小就不一样。所以语音识别是典型的seq2seq问题。 上图中X是提取的mfcc向量序列,Y是token序列,token的粒度可以是字符,字,词,音素。传统的语音识别一般将Y转换为S,S是相.原创 2021-05-25 16:34:41 · 1300 阅读 · 0 评论 -
ubuntu20.04+cuda11+kaldi 安装
方案:ubuntu20.04+cuda11+kaldi 本人多次安装实践总结,安装kaldi最佳时间为北京时间早上6点-9点, 这段时间安装成功率最高,不会遇到卡死,断网,下载包失败等糟心的事。 网上说安装kaldi需要借助上网工具加速,这种说法也不太准确,我多次安装均在正常网络环境。 网上有文章说kaldi不能适配cuda11,要改配置。但我用的就是cuda11, 不需要改任何配置,成功安装跑起来嗖嗖的。 如果没GPU装kaldi没太大意思,还是先解决GPU在考虑安装问题吧。 前期准备工作: 确定操原创 2021-03-10 23:49:26 · 1394 阅读 · 6 评论 -
目录更换磁盘分区的总结
如何更换磁盘分区,操作过程请看这篇文章 给现有目录换分区这种操作纯属linux使用,一般研发人员很少接触到。这种操作搞运维的人员肯定很熟。我只是用kaldi举了个例子,其实没讲关于kadli东西。下面对目录换分区做一个一般化的总结 第一,给目录换分区有两种方式,第一种就是将分区挂载到目录, 第二种将目录挂载到目录。两种方式都要求目录是已知存在的,如果不存在,必须先事先新建目录,然后再进行挂载。如果目录已存在且该目录已经有内容 了,如果想挂载后继续使用这个目录现有的文件,这个时候先要对内容进行备份。然后再挂载原创 2021-03-01 09:30:08 · 182 阅读 · 0 评论 -
给 kaldi 的egs 目录搬家
给 kaldi 的egs 目录搬家 问题提出 服务器有两块硬盘,一块500G SSD固态硬盘, 一块1.8T机械硬盘。固态盘是系统盘,kaldi装在系统盘上了。最近跑librispeech recipe,疯狂下载数据集,把系统盘空间占满了。kaldi下egs目录占用空间最大,如何不改变kaldi目录结构,将egs内容移动到其它磁盘上,给系统盘的瘦身。 egs目录大小 (base) root@ai-PowerEdge-R740:/# du -sh /opt/asr/kaldi/egs/ 251G原创 2021-02-27 23:36:20 · 277 阅读 · 0 评论