ASR
文章平均质量分 59
一片橡树叶子的故事
这个作者很懒,什么都没留下…
展开
-
linux中flac安装
在跑mini_librispeech的时候,下载好数据会提示Please install ‘flac’ on ALL worker nodes!这是因为数据集是flac的压缩格式,而Linux系统没有安装解码的软件,所以我们需要安装flac。第一步 下载wget https://downloads.xiph.org/releases/flac/flac-1.3.3.tar.xzwget http://www.linuxfromscratch.org/patches/blfs/svn/flac-1.原创 2021-04-30 15:28:10 · 1658 阅读 · 1 评论 -
swig安装
https://www.cnblogs.com/no-tears-girl/p/10456738.htmlhttps://www.cnblogs.com/no-tears-girl/p/10456738.html下载网址http://www.linuxfromscratch.org/blfs/view/cvs/general/swig.html原创 2020-09-28 13:54:59 · 287 阅读 · 1 评论 -
正则化表达式学习
https://www.runoob.com/regexp/regexp-tutorial.html原创 2020-09-25 14:57:09 · 83 阅读 · 0 评论 -
结巴分词-参考
https://github.com/fxsjy/jieba原创 2020-09-23 13:55:40 · 101 阅读 · 0 评论 -
如何修改txt文本文件的默认编码为UTF-8
https://zhidao.baidu.com/question/560895811224581924.html原创 2020-09-23 10:33:06 · 4624 阅读 · 0 评论 -
Python工具包phkit遇到的问题
问题描述发现文件夹中文件是正常存在的解决办法:将with open(inpath, ..) ..... 中的inpath改成str(inpath),遍历所有的上述问题,解决。具体原因:pathlib integrates seemlessly with open only in Python 3.6 and later. From Python 3.6's release notes:The built-in open() function has bee...原创 2020-09-23 10:31:04 · 470 阅读 · 0 评论 -
[参考]kaldi学习笔记 -- 构造语言模型相关脚本 -- ami_train_lms.sh,utils/format_lm.sh
https://blog.csdn.net/DuishengChen/article/details/52514477原创 2020-09-17 16:45:55 · 131 阅读 · 0 评论 -
ASR: DNN训练 & kaldi 神经网络
https://www.jianshu.com/p/c5fb943afaba原创 2020-09-17 16:44:05 · 345 阅读 · 0 评论 -
特征变换
https://blog.csdn.net/JackyTintin/article/details/79803501原创 2020-09-17 15:17:15 · 129 阅读 · 0 评论 -
irstlm手动安装
首先 手动下载irstlm.zip,并复制到tools目录中,利用命令解压到irstlm/https://github.com/irstlm-team/irstlm.git 然后 按照下面步骤安装:HOW TO INSTALL WITH AUTOMAKEStep 0:$> sh regenerate-makefiles.sh [--force]Set parameter force to the value "--force" if you want to re...原创 2020-09-16 15:58:24 · 723 阅读 · 0 评论 -
2020-09-09语音识别系列之区分性训练和LF-MMI
在传统的语音识别中,区分性训练扮演着非常重要的角色,是语音识别学习中的一个重点和难点。如今,端到端的语音识别系统虽初露锋芒,是目前语音识别研究的热点,但在实际工业应用中,传统的语音识别仍然占据着主导地位,区分性训练仍然发挥着重要角色。并且,区分性训练更重要的是其基本思想,相信其思想和基本方法未来也会在端到端的语音识别系统中有广泛应用。所以,值得一写,值得一看,值得一学。本文介绍区分性训练、其改进版本LF-MMI(Lattice Free Maximum Mutual Information)和Kaldi转载 2020-09-09 17:34:12 · 1014 阅读 · 0 评论 -
语音识别——kaldi - Online Audio Server(服务器客户端建立方法-旧版在线解码)
文章目录 一、服务器客户端识别系统建立方法 1. Command line to start the **server**(服务器端启动方式): 1.1 Arguments are as follow(参数意义): 2. Command line to start the **client**(客户端启动方式): 2.1 Arguments are as follow(参数意义): * Command line to start the Java cli转载 2020-09-02 16:52:53 · 838 阅读 · 0 评论 -
kaldi中aishell运行时出现的GPU问题及解决办法
问题 1:This script is intended to be used with GPUs but you have not compiled Kaldi with CUDAIf you want to use GPUs (and have them), go to src/, and configure and make on a machinewhere "nvcc" is installed.解决办法:cd 到src目录下,检查src/configure文件中cuda安装路径是原创 2020-08-19 14:08:55 · 1115 阅读 · 1 评论 -
kaldi安装过程
1.下载kaldi的文件git clone https://github.com/kaldi-asr/kaldi.git12.进入toolscd toolscat INSTALL1 2按照指令一步步进行extras/check_dependencies.sh#检查依赖性,没有的包按照指令安装make or make -j 4(多线程加快进度)1 2 3 4 53.进入srccd srccat INSTALL1 2按照指令安装转载 2020-08-18 10:08:49 · 300 阅读 · 0 评论 -
kaldi入门详解——aishell步骤解释
kaildi讲解kaldi是一个开源的语音识别工具箱,是基于c++、perl、shell编写的,可以在windows和unix 平台上编译。教程网页:http://www.kaldi-asr.org/doc/ 里面可以查阅语音/说话人识别实现过程、kaldi的数据结构、命令的使用说明等。还有网上的dan的ppt。kaldi下载:https://github.com/kaldi-asr/kaldi。语音识别基础知识快速入门英文:《Speech and Language Processing转载 2020-08-18 10:06:44 · 3781 阅读 · 3 评论 -
语音识别第1讲:概述
自动语音识别(Automatic Speech Recognition,ASR),简称为语音识别。参考:语音识别综述-从概念到技术1. 概述声音从本质是一种波,这种波可以作为一种信号来处理,所以语音识别的输入实际上就是一段随时间播放的信号序列,而输出则是一段文本序列。将语音片段输入转化为文本输出的过程就是语音识别。一个完整的语音识别系统通常包括信号处理和特征提取、声学模型、语音模型和解码搜索这四个模块。信号处理和特征提取可以视作音频数据的预处理部分,一般来熟,一段高保真、无噪声的转载 2020-08-10 15:44:41 · 875 阅读 · 0 评论 -
Kaldi入门:yesno项目
这个学期选了一门自然语言处理课,结果这门课主要的研究课题是自动语音识别(ASR)。既然入了这个坑。就先好好了解一下如何做ASR吧。老师Tom Ko要求使用Kaldi这个工具来做ASR。课上到一半才知道Kaldi中有几千行的脚本代码是老师提交的。好吧,脚本好难的。为了入门Kaldi,课程的第5次Lab是一个mini projec: yesno首先要下载并编译Kaldi,安装的过程不是我的学习重点,可以先参考Kaldi的下载安装与编译,在漫长的编译过程之后假设已经安装好了Kaldi。项目目录结构转载 2020-08-07 15:45:41 · 1177 阅读 · 0 评论 -
THCHS-30:一个免费的中文语料库(背景介绍)
摘要和第一部分是介绍目前语音识别开源语音库的现状,包括英文和中文的,由此引出来THCHS-30语料库。都是一些无关痛痒的介绍,所以不做翻译了。以下是正式翻译:2 THCHS-30的特点这部分我们介绍THCHS-30语音库。这个数据库是在2000-2001年记录的,第一个作者是Prof.Xiaoyan Zhu的一个研究生。这个语音库设计的目的是作为863数据库的补充,尽可能提高中文发音的涵盖率。这个新数据库叫TCMSD(清华大学连续普通话数据库),而且变得 更加开放。。我们15年前发布了这个数据库转载 2020-08-07 15:41:12 · 2306 阅读 · 0 评论 -
语音信号处理之(四)梅尔频率倒谱系数(MFCC)
语音信号处理之(四)梅尔频率倒谱系数(MFCC)zouxy09@qq.comhttp://blog.csdn.net/zouxy09 这学期有《语音信号处理》这门课,快考试了,所以也要了解了解相关的知识点。呵呵,平时没怎么听课,现在只能抱佛脚了。顺便也总结总结,好让自己的知识架构清晰点,也和大家分享下。下面总结的是第四个知识点:MFCC。因为花的时间不多,所以可能会有不少说的不妥的地方,还望大家指正。谢谢。 在任意一个Automatic speech rec...转载 2020-08-07 15:04:10 · 676 阅读 · 0 评论 -
FST(Finite State Transducers, 有限状态转换器)简介及示例
一、简介Finite State Transducers 简称 FST, 中文名:有穷状态转换器。FST目前在语音识别和自然语言搜索、处理等方向被广泛应用。例如,在自然语言处理中,经常会遇到一些针对某些内容法则做出修改的操作,比如:如果c的后面紧接x的话,则把c变为b,FST则是基于这些规则上的数学操作,来把若干个规则整合成一个单程的大型规则,以有效提高基于规则的系统(rule-based system)的效率。其功能类似于字典的功能(STL 中的map,C# 中的Dictionary),但其查找是转载 2020-08-07 14:58:36 · 13036 阅读 · 2 评论 -
kaldi 运行thch30遇到问题PortAudio failed to open the default stream 和 online-gmm-decode-faster: 未找到命令
问题1:PortAudio failed to open the default stream解决方案:1、检查linux系统录音功能是否可用:arecord -d 10 test.wav检查后发现可以录音2、检查portaudio是否安装成功进入kaldi/tools目录 cd kaldi/tools重新安装 ./install_portaduio.sh如果之前安装过一遍,一定要先进入tools/portaudio,然后make clean,否则没有用。有些时候一些依赖没有也会安装...转载 2020-08-07 14:56:47 · 612 阅读 · 0 评论