自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

audio_algorithm的博客

专注于音频数字信号处理领域,欢迎志同道合的朋友一起探讨!

  • 博客(7)
  • 资源 (5)
  • 收藏
  • 关注

转载 keras中epoch,batch,loss,val_loss相关概念

1、epochKeras官方文档中给出的解释是:“简单说,epochs指的就是训练过程接中数据将被“轮”多少次”(1)释义:训练过程中当一个完整的数据集通过了神经网络一次并且返回了一次,这个过程称为一个epoch,网络会在每个epoch结束时报告关于模型学习进度的调试信息。(2)为什么要训练多个epoch,即数据要被“轮”多次在神经网络中传递完整的数据集一次是不够的,对于有限的...

2019-04-23 10:56:57 13267 3

原创 语音唤醒

唤醒可以看成是一种小资源的关键词检索任务,其中小资源是指计算资源比较小和空间存储资源比较小,因此它的系统框架跟关键词检索的系统会有一定的区别,目前常用的系统框架主要有Keyword/Filler Hidden Markov Model System和Deep KWS System两种。 第一种被称为基于HMM的Keyword and Filler系统,这类系统的关键是上图中左...

2019-04-22 19:51:16 11463

转载 keras搭建LSTM处理可变 长序列

众所周知,LSTM的一大优势就是其能够处理变长序列。而在使用keras搭建模型时,如果直接使用LSTM层作为网络输入的第一层,需要指定输入的大小。如果需要使用变长序列,那么,只需要在LSTM层前加一个Masking层,或者embedding层即可。 1 2 3 4 5 fromkeras.layersimportMasking,...

2019-04-20 11:57:57 2371

原创 tensorflow从checkpoint中提取模型从参数

2019-04-13 11:40:17 1242

原创 tensorflow从pb文件导出模型图

运行下面的程序,将graph信心保存在log目录:#!/usr/bin/env python# -*- coding:utf-8 -*-import tensorflow as tffrom tensorflow.python.platform import gfilemodel = 'model.pb' #请将这里的pb文件路径改为自己的graph = tf.get_default...

2019-04-13 10:46:26 1108

转载 kaldi训练mono-phone——强制对齐

kaldi中训练声学模型,首先是训练单音素模型,即mono-phone过程,本文主要讲述mono-phone训练的过程。代码为steps/train_mono.sh用法如下所示:steps/train_mono.sh [options] <training-data-dir> <lang-dir> <exp-dir>training-data...

2019-04-10 14:39:12 3206 1

原创 kaldi运行timit

1、下载timit数据,将数据解压在egs/timit/data 目录下2、打开s5目录,编辑run.sh 如下(根据timit数据存放的目录修改):echo ============================================================================echo " Data & Lexico...

2019-04-09 20:07:35 1074 1

Download.zip

一些可以参考的行业文档知识,供学习用EVRC--ns

2019-11-29

Design of circular differential microphone array (1).pdf

Design of circular differential microphone array,

2019-06-12

keras快速入门

快速入门keras,这个是keras官网的中文翻译版本,写得还是比较详细的,适合刚入门的学习

2019-05-07

识别引擎解码1 pass VS 2 pass

识别引擎搜索策略对比,传统2 pass 方法 与 1 pass 方法(WFST)对比

2019-03-27

语音识别基本法

HMM-GMM,HMM-DNN语音识别原理介绍,比较基础,易懂。适合入门者

2019-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除