自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 资源 (2)
  • 收藏
  • 关注

原创 常用语音数据库

大多数语音识别数据集是专有的,因为这些数据对于创建该数据集的公司来说具有很大价值。因此,这部分的可用公开数据集多数比较陈旧。【学术、陈旧】2000 HUB5 English:仅包含英语的语音数据集,百度最近的论文《深度语音:扩展端对端语音识别》使用的是这个数据集。 地址:https://catalog.ldc.upenn.edu/LDC2002T43 【学术】LibriSpeech...

2018-07-25 11:42:02 9869 2

原创 【UNITY】Prefab定义

Prefab是什么? Prefab我们通常称为预设体(或预制件,预制体)。作用: 在开发一些功能的时候, 将一些能够复用的对象制作成预设体(可以是模型,窗口,特效等),可以将预设体存放到 Resources 目录之下,通过动态加载的方式加载到场景中并进行实例化。优点: 1、频繁创建物体时,使用prefab可以节省内存 2、相同的物体进行同样的操作,可以使用prefab直接操作一次就好了 3、使用prefab可以动态的加载已...

2021-12-02 13:37:24 3522

原创 数字院区开发过程记录

U3D新手,用于记录项目开发过程所遇到的“坑”与“所学”。1、项目导出分辨率低,模糊解决办法:Assets-Project Setting2。更改游戏项目名字,即左上角名字:3.场景界面跳转代码:using UnityEngine.UI;using UnityEngine;using System.Collections;using System.Collections.Generic;using UnityEngine.SceneManagement;publi..

2021-11-08 09:19:13 126

原创 windows 安装程序卡在左上角

windows 安装程序卡在左上角 --- 调整分辨率即可解决

2021-10-07 16:19:46 594

原创 语音识别研究方向

远场语音识别 1)语音激活检测(VAD)```需求背景:在近场识别场景,比如使用语音输入法时,用户可以用手按着语音按键说话,结束之后松开,由于近场情况下信噪比(signal to noise ratio, SNR))比较高,信号清晰,简单算法也能做到有效可靠。但远场识别场景下,用户不能用手接触设备,这时噪声比较大,SNR下降剧烈,必须使用VAD了。``` 2)语音唤醒 (voice trigger,VT)```需求背景:在近场识别时,用户可以点击按钮后直接说话,但是远场识别时,需要...

2021-10-07 16:00:21 2063

原创 语音识别技术基础知识

语音识别技术让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。 语音识别本质上是一种模式识别的过程,未知语音的模式与已知语音的参考模式逐一进行比较,最佳匹配的参考模式被作为识别结果。 语音识别的目的就是让机器赋予人的听觉特性,听懂人说什么,并作出相应的动作。目前大多数语音识别技术是基于统计模式的,从语音产生机理来看,语音识别可以分为语音层和语言层两部分。 语音识别技术的主流算法,主要有基于动态时间规整(DTW)算法、基于非参数模型的矢量量化(VQ)方法、...

2021-10-07 15:59:40 5720

原创 SPHINX-孤立词语音识别

sphinx 语音识别系统Sphinx 是由美国卡内基梅隆大学开发的大词汇量、非特定人、连续英语语音识别系统。Sphinx的研究工作已经开展了30多年,从李开复等人开发的Sphinxl到现今已经发展到了Sphinx4。Sphinx系统的鲁棒性强、可扩充性很好,并且代码开源代码,使得世界各地语音研究工作者能够利用它进行语音识别的研究工作。本章主要对该系统的构成和理论基础做个详细介绍。Sphinx是开放源代码的语音识别软件包,它可以运行在多种平台上。其中被广泛使用的是Sphinx2,同时广泛应用于嵌

2021-10-07 15:58:02 603

原创 Matlab-BP

第三节 BP神经网络在matlab的实现人工神经元模型BP的两种思想 误差反向传播应用梯度下降法,更新后的权重 = 原有权重 + 误差项 = 原有权重 + 学习率 * 误差率 *微分项输入数据切记归一化问题什么是归一化?–将数据映射到[0, 1]或[-1, 1]区间或其他的区间。为什么要归一化?–输入数据的单位不一样,有些数据的范围可能特别大,导致的结果是神经网络收敛慢、训练时间长。–数据范围大的...

2021-10-07 15:56:59 246

原创 Matlab基础

第一节 Contents I. 清空环境变量及命令 II. 变量命令规则 III. MATLAB数据类型 IV. MATLAB矩阵操作 V. MATLAB逻辑与流程控制 VI. MATLAB脚本与函数文件 VII. MATLAB基本绘图操作 VIII. MATLAB文件导入 清空环境变量及命令 clear all % 清除Workspace中的所有变量 clc ...

2021-10-07 15:55:36 204

原创 语音识别概括图

2021-10-07 15:54:26 207

原创 马尔可夫模型概念

马尔科夫模型 背景知识 1随机过程 2 马尔可夫性质 3 马尔可夫链 4 模式的形成 隐马尔可夫模型 1马尔可夫过程的局限性 2 隐马尔可夫模型定义 forward算法 1 局部概率 2 计算t 1时刻的值 3 计算t 1时候的值 viterbi算法 1 局部概率与局部最优路径 2 计算t 1时刻的值

2021-10-07 15:53:01 13357

原创 Ubuntu-基础指令汇总

Ubuntu 常用命令大全查看类查看软件 xxx 安装内容 #dpkg -L xxx查找软件 #apt-cache search 正则表达式查找文件属于哪个包 #dpkg -S filename apt-file search filename查询软件 xxx 依赖哪些包 #apt-cache depends xxx查询软件 xxx 被哪些包依赖 #apt-cache rdepends xxx...

2021-10-07 15:50:27 1194

原创 UNITY-C#基础知识

1.定义变量Unity 3D 脚本挂到某个 Unity 3D 对象上,在 Unity 3D 的属性面板中就会显示出该脚本中的各个公共变量。开发人员也可以在属性面板中对公共变量的值进行设置,设置后的值将会影响脚本的运行,相当于在脚本中对该变量进行了赋值。2.数据类型1.整数2.浮点3.布尔4.字符5.引用引用类型是构建 C# 应用程序的主要数据类型,C# 的所有引用类型均派生自 System.Object。引用类型可以派生出新的类型,也可以包含空(null)值。引用类型变量的赋值只

2021-10-07 15:39:52 1430

原创 解决win10输入法卡顿问题

问题:解决win10输入法卡顿问题卡顿原因:用户的输入法配置文件由于各种原因出现了错误或损坏导致的,只好直接删除让输入法重新建一个了。另外删除后应该会删掉用户个人的词频调整配置解决方法:找到自己的输入法的本地词库及配置文件目录,C:\Users\用户名\AppData\Roaming\Microsoft\InputMethod\Chs;将整个Chs文件...

2020-04-05 09:54:21 11065 9

转载 ubuntu 问题汇总

循环登录问题:https://blog.csdn.net/QLULIBIN/article/details/79568916驱动安装问题:https://blog.csdn.net/QLULIBIN/article/details/79947062

2019-05-20 18:59:59 170

原创 Ubuntu 14.04 Nvidia显卡驱动安装及设置

Ubuntu 14.04 Nvidia显卡驱动安装及设置更换主板修复grub 引导后,无法从Nvidia进入系统(光标闪烁), 可能是显卡驱动出了问题。1. 进入BIOS设置, 从集成显卡进入系统将显示器连接到集显的VGI口, 并在BIOS中设置用集显显示, 一般来说可以成功进入系统。2. 完全写在Nvidia驱动 (参考)执行下列命令干干净净卸载nvidia驱动,su...

2019-03-08 10:34:11 245

原创 kaldi-yesno例子

"yesno"语料库是一个非常小打一个人的录音数据集,测试集在单声道阶段完全被识别WER(WordError Rate)是字错误率,是一个衡量语音识别系统的准确程度的度量。其计算公式是WER=(I+D+S)/N,I代表被插入的单词个数D代表被删除的单词个数S代表被替换的单词个数通俗来讲是把识别出来的结果中,多认的,少认的,认错的全都加起来,除以总单词数。这个数字当然是越低越...

2018-07-25 15:47:50 1669 1

原创 ubuntu16.04 cuda8.0 kaldi安装

经过长时间打折磨最终安装成功(GTX650显卡)分享过程以及怕自己忘。。1 安装GTX650驱动sudo add-apt-repository ppa:graphics-drivers/ppasudo apt-get updatesudo apt-get install nvidia-384sudo apt-get install mesa-common-devsudo ap...

2018-07-24 19:35:20 682

05 自编码器图像去噪.7z

应用自编码器对图像进行去噪,包含加噪声的图片,去噪声声的图片,去噪后的对比图及源码python文档及自编码器的模型

2019-12-10

matlab在语音信号分析与合成中的应用pdf 全书

全书387页,内容清晰,文件大小188兆,仅供相互学习,请勿用于商业用途,若有侵权,立刻删除。

2018-05-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除