![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
asr
文章平均质量分 95
西岸行者
问君能有几多愁,恰似一只鸡腿进不了口
展开
-
通过实例学习理解HMM建模
通过实例学习理解HMM建模例子1-什么是马尔科夫过程Markov process-马尔科夫过程Observable-State Markov Process-显式马尔科夫过程Hidden-State Markov Process-隐式马尔科夫过程小结例子2-Markov Chains 马尔科夫链ergodic Markov chains-遍历型left–right Markov chains-左右型(因果型)怎么理解HMMHMM的基本元素S-模型中状态的有限集合O-模型输出的观测值符号信合A-状态转移概率矩原创 2021-08-13 17:29:26 · 636 阅读 · 0 评论 -
泰勒级数在语音增强中的应用
原来泰勒级数也能被拿来做语音增强扫盲=前言泰勒级数定义泰勒级数扩展多变量泰勒级数多变量矢量函数的泰勒展开应用方向VTS在变换域的鲁棒性应用环境建模参考文档扫盲=前言这些储备知识有的忘记了,有的就没学过,还要从头慢慢来学泰勒级数定义【摘抄百度】泰勒级数是以于1715年发表了泰勒公式的英国数学家布鲁克·泰勒(Sir Brook Taylor)的名字来命名的。通过函数在自变量零点的导数求得的泰勒级数又叫做麦克劳林级数,无限项连加式(级数)来表示一个函数,这些相加的项由函数在某一点的导数求得。说到此其实跟原创 2021-06-24 16:22:13 · 362 阅读 · 0 评论 -
从MIXMAX概率模型理解Bayesian建模方法
MIXMAX 概率模型理解储备知识HMM-隐马尔可夫模型(Hidden Markov Model)GMM-混合高斯模型多元高斯分布(The Multivariate normal distribution)多元高斯还是混合高斯Bayesian概率模型储备知识HMM-隐马尔可夫模型(Hidden Markov Model)HMM建模时需要目标有这两个特征:基于序列的,比如时间序列,或者状态序列。有两类数据,一类序列数据是可以观测到的,即观测序列;而另一类数据是不能观察到的,即隐藏状态序列,简称状态原创 2021-04-14 14:49:07 · 335 阅读 · 0 评论 -
Zero shot Learning 论文学习笔记(未完待续)
我跨过山河大海,也穿过人山人海......前面还是高山大海,人山人海。初入机器学习的大门,爬上DEEPLEARNING的高山,发现前面还是高山,更多,更高,更难爬......ZST就是一座待爬的高山,很显然,“不学习就会ZST”,“或者一学就会OST”的愿景是美好的,正如小时候看的武侠小说和电影里讲的回梦心经等等神奇武功,但现实却告诉你,要想达成这样的本领,你要学的就更多了,学多了就可以触类旁通,事半功倍,机器学习也是这个道理。原创 2020-10-19 19:17:04 · 1654 阅读 · 1 评论 -
神经网络优化学习思考
神经网络优化学习思考本文记录学习过程的一些思考,整体前后逻辑性不是很连贯。神经网络的主要工作可以总结为优化,而整个优化过程大致如下流程(手懒,直接上照骗了):超参数网络的层数,权重个数,偏置个数以及初始化值,卷积核的大小和层数,学习率等等。为什么分三个集合评估模型的重点是将数据划分为三个集合:训练集、验证集和测试集。在训练数据上训练模型,在验证数据上评估模型。一旦找到了最佳参数,就在...原创 2019-11-25 18:02:01 · 257 阅读 · 0 评论 -
wav2letter++ 第一次training 日志
第一次训练w2l,遇到了一些软件依赖的问题。记录一下,以备后查。在wav2letter和libsndfile之间的依赖问题上卡壳了很久,浪费了很多时间。原创 2019-10-01 13:18:17 · 1340 阅读 · 4 评论 -
语音特征提取学习笔记--对比kaldi、htk、w2l的语音提取过程。
任何模式识别系统的第一个问题都是选择什么样的特征作为系统的输入,与语音识别也不例外,为了准确地反映待测系统的特性,并且让识别系统本身容易处理和分类,语音专家经过了几十年的研究,各种各样的语音特性提取也被提出来,而在经典的GMM-HMM模型中,MFCC是绝对的C位。不过在KALDI和HTK软件中,除了MFCC,其实还提供了其他一些特性提取方法,其中就包括PLP和FilterBank。本文又加入了w2l,目前最流行的开源人工智能网络ASR工具集,横向比较中,了解和学习一下语音提取技术的特点和发展。原创 2019-09-26 11:05:15 · 3373 阅读 · 0 评论 -
wav2letter++ 环境安装记录
wav2letter是一个快速开源的语音识别工具集,是由facebook ai 研究所的语音团队开发,通过End to End(端到端)的ai模型,旨在实现Lexicon-free(无字典)语音识别的目标。主要参考两篇中文的安装介绍:Building wav2letter++ 安装依赖 https://www.jianshu.com/p/50a3100a5bca开源自动语音识别系统wav2l...原创 2019-09-18 16:55:50 · 1304 阅读 · 0 评论 -
ubuntu 16.04在CPU 模式下安装arrayfire
ubuntu 16.04在CPU 模式下安装arrayfire官方安装 支持下载包,也提供一个大的.sh文件,为了解决依赖,选择用下载包,参考下面的一篇博文:https://www.jianshu.com/p/50a3100a5bca安装指令如下:sudo apt-get install -y build-essential git cmake libfreeimage-devsudo ...原创 2019-09-16 19:40:08 · 443 阅读 · 0 评论 -
ubuntu14.04安装htk 3.5beta最新版
ubuntu14.04安装htk 3.5betaHTK是一个用于构建隐马尔可夫模型(HMM)的工具包。隐马模型可用于对任意时间序列建模,与此类似,HTK的核心部分也是具有通用性的。然而,HTK主要还是用于构建基于HMM的语音处理工具,特别是语音识别工具。因此HTK的在基层架构上提供的功能,主要是为了完成这个任务。如上图所示,这个任务主要由两个阶段构成。首先,HTK的训练工具基于语音数据和关联的脚...原创 2019-08-20 15:08:39 · 353 阅读 · 0 评论