自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 【语音识别】语言模型LM

在经过孤立词识别之后,需要进入实际应用,也就是实际的语境中的识别,现实生活的语境往往十分复杂,比如方言,断句,省略词等,而且会面对无法预测的未知词语。这章的语言模型则是对这些问题一一分解分析。

2022-08-25 13:21:50 1437

原创 【语音识别】基于DNN-HMM的语音系统

这里对比了GMM-HMM的语音识别系统与加入神经网络的DNN-HMM语音识别系统,并针对四种不同模式的神经网络进行了对比。

2022-08-11 19:14:04 1828

原创 【语音识别】基于GMM-HMM的语音识别系统

如题,这部分结合了这系列前面几章的知识,做了一个建议的语音识别系统。

2022-07-29 13:51:30 1242 2

原创 【语音识别】隐马尔可夫模型HMM

隐马尔可夫模型是一种概率图模型。我们知道,机器学习模型可以从频率派和贝叶斯派两个方向考虑,在频率派的方法中的核心是优化问题,而在贝叶斯派的方法中,核心是积分问题,也发展出来了一系列的积分方法如变分推断,MCMC 等。......

2022-07-20 13:11:07 1340

翻译 【Python】MFCC算法需要用到的库函数

在看mfcc实现代码的时候有一些函数感觉记一下用法比较好,于是从官方文档搬运一下。

2022-07-16 02:31:37 634

原创 【语音识别】EM算法和GMM模型

本章主要从概率论方面讲述了GMM模型和EM算法的底层原理,即通过已知推测未知,再通过上次所得到的结果,来推导下一轮的结果,直到这个结果与上一轮的结果误差在我们设定的范围内,就视为我们得到了想要的结果。...

2022-07-15 14:21:52 1183

原创 【语音识别】kaldi安装心得

kaldi安装过程中遇到的问题与解决方案

2022-07-06 18:50:46 1025

原创 【语音识别】MFCC特征提取

语音信号特征提取,从数字信号处理基础到常用特征提取方法

2022-07-05 21:12:40 2439 1

原创 【语音识别入门】基础概念与框架

1.对语音识别的概念理解2.语音合成3.语音感知4.现代语音识别2020.6.241.语音转为文本2.让机器听清楚内容3.解决同音词误听4.解决“共性”问题:多人说话,每个人都能识别不属于语音识别范畴的常见误区:1.声纹识别:辨别说话人2.语言情感识别与信息分析3.语言理解评估指标分两大类:accuracy,efficiencyAccuracy:·音素错误率 (Phone Error Rate)• 词错误率 (Word Error Rate, WER)• 字错误率 (Charac

2022-06-29 18:01:41 837

转载 MySQL 服务正在启动 . MySQL 服务无法启动

“MySQL 服务正在启动 . MySQL 服务无法启动。 服务没有报告任何错误。”的解决方案大概就是从几个大佬那边抄来的作业…1.检查错误来源命令:mysqld --console然后根据打印出来不同的结果来对症下药1)来自 koloumi大佬的解决方案原文地址:https://blog.csdn.net/koloumi/article/details/83117497核心报错语句...

2019-04-08 23:27:40 468

转载 关于AS安装之后的一些细碎事项

1.模拟器安装习惯用夜神模拟器了,毕竟之前玩五行师的时候就一直用它。连接的时候先用cmd进nox的安装文件夹bin,之后输入nox_adb.exe connect localhost:62001如果想要快捷进入该文件夹,那就在文件资源管理器下面打开这个文件夹,再在地址栏里面输出cmd,再回车即可。(03/26/2019)2.之后陆续更新...

2019-03-26 18:29:31 104

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除