语音识别
文章平均质量分 84
语音识别笔记ASR
jmu_hjc
这个作者很懒,什么都没留下…
展开
-
机器学习(七)——SVM
支持向量机(Support Vector Machine,简称SVM)是一种经典的机器学习算法,它在解决小样本非线性及高维模式识别等问题中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中。是一种二分类模型监督性学习。目的是找到集合边缘上的若干数据(支持向量)用这些点找出一个平面(决策面)使支持向量到该平面的距离最大。原创 2023-12-06 20:03:47 · 974 阅读 · 0 评论 -
实现前向算法后向算法Viterbi算法
这段代码是关于隐马尔可夫模型(HMM)的三种算法:前向算法(forward_algorithm)、后向算法(backward_algorithm)和维特比算法(Viterbi_algorithm)。HMM 是一种用于处理序列数据的概率模型,主要用于预测给定观测序列下的状态序列。前向算法(forward_algorithm):计算给定观测序列 O 下,HMM 模型生成该序列的概率。该算法通过计算前向变量α(alpha)来预测每个时间步的状态概率。原创 2023-11-14 22:15:47 · 302 阅读 · 0 评论 -
机器学习(五)——朴素贝叶斯
朴素贝叶斯算法是一种基于贝叶斯定理和条件独立性假设的分类方法。其中,朴素贝叶斯的朴素代表属性之间独立。该算法的核心思想分为两个部分:首先,基于特征条件独立性假设,算法学习输入和输出的联合概率分布。然后,利用贝叶斯定理,对于给定的输入特征 x,计算各个输出类别 y 的后验概率。垃圾邮件分类数据集是一组用于训练和测试垃圾分类模型的数据,主要包括不同类型垃圾的分类信息和相关特征。垃圾分类数据集可以,实现对垃圾的自动分类。新闻分类数据集是用于训练和测试新闻文本分类模型的数据集,包含大量新闻文章及其。原创 2023-11-14 21:45:28 · 177 阅读 · 0 评论 -
基于GMM的(o/0-9)孤立词识别系统
本次所用的数据为0-9(其中0的标签为Z(Zero))和o这11个字符的英文录音,每个录音的原始录音文件和39维的MFCC特征都已经提供,每个字符用一个GMM来建模,在测试阶段,对于某句话,对数似然最大的模型对应的字符为当前语音数据的预测的标签(target)训练数据:330句话,每个字符30句话,11个字符测试数据:110句话,每个字符10句话,11个字符训练数据:330句话,每个字符30句话,11个字符测试数据:110句话,每个字符10句话,11个字符。原创 2023-10-25 11:04:03 · 162 阅读 · 1 评论 -
机器学习(二)——KNN算法
机器学习实验报告(二)——基于KNN算法实现鸢尾花分类和数字信号1-5的分类原创 2023-09-29 13:38:56 · 579 阅读 · 0 评论 -
语音识别特征提取(Fbank和MFCC)
mfcc和fbank特征提取原创 2023-07-02 21:29:39 · 489 阅读 · 1 评论 -
kaldi的安装过程记录
kaldi工具安装原创 2023-07-01 14:54:11 · 645 阅读 · 2 评论