语音识别
文章平均质量分 79
章魚.
这个作者很懒,什么都没留下…
展开
-
语音识别——解码器(WFST、Lattice)
基于Viterbi的原始动态解码器使用广度优先搜索在原始的搜索网络中同时生成多条假设,并且依靠剪枝算法不会使网络变得太大。原创 2022-10-22 20:52:40 · 2952 阅读 · 0 评论 -
加权有限状态转录机(Weighted Finite-State Transducer/WFST)
加权有限状态转录机(Weighted Finite-State Transducer/WFST):其每条边上不仅是一个pair,还有对应的权重,此外初始状态和终止状态也有对应的初始weight和终止weight。原创 2022-10-20 21:31:12 · 615 阅读 · 0 评论 -
N-gram语言模型
N-Gram是大词汇连续语音识别中常用的一种语言模型。该模型基于这样一种假设,第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现概率的乘积。原创 2022-10-19 22:06:38 · 1366 阅读 · 0 评论 -
MFCC特征提取
在语音识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。 MFCC的提取过程包括预处理、快速傅里叶变换、Mei滤波器组、对数运算、离散余弦变换、动态特征提取等步骤。原创 2022-10-18 16:37:45 · 9820 阅读 · 0 评论 -
傅里叶变换概述
离散傅立叶变换在数字信号处理中几乎可以说是一个的必学的钦定函数,多年来在图像,音频,噪声处理,信号调制解调中发挥着巨大的作用。原创 2022-10-17 19:36:25 · 6489 阅读 · 0 评论 -
基于GMM—HMM的语音识别全过程
语音识别技术就是让机器通过识别与理解把语音信号转换为相应的文本或命令的技术。原创 2022-10-16 21:17:49 · 2210 阅读 · 1 评论 -
高斯混合模型(GMM,GOM)
基本思想:用多个高斯分布函数(正态分布)去近似任意形状的概率分布。将待聚类的数据点看成是分布的采样点,通过采样点利用类似极大似然估计的方法估计高斯分布的参数,求出参数(用EM算法求解)即得出了数据点对分类的隶属函数。原创 2022-10-16 17:44:21 · 905 阅读 · 0 评论 -
K均值聚类(K-means)算法
K-Means算法是聚类中的基础算法,也是无监督学习里的一个重要方法。原创 2022-10-16 16:53:59 · 254 阅读 · 0 评论 -
HMM—解码问题(维特比(Viterbi)、A*、beam search )
已知模型和观测序列求状态序列原创 2022-10-15 21:06:51 · 800 阅读 · 0 评论 -
HMM——参数学习问题(求解参数)
Baum_Welch算法 EM算法原创 2022-10-15 20:10:51 · 550 阅读 · 0 评论 -
HMM——求观测序列的概率
HMM——求观测序列的概率原创 2022-10-14 22:04:47 · 397 阅读 · 0 评论 -
隐马尔科夫模型(Hidden Markov Model,HMM)——前提
隐马尔科夫模型(Hidden Markov Model,HMM)——前提原创 2022-10-14 15:58:08 · 361 阅读 · 1 评论