2019年04月_audiocool

09月 08月 06月 05月 04月 03月

转载 keras中epoch,batch,loss,val_loss相关概念

1、epochKeras官方文档中给出的解释是：“简单说，epochs指的就是训练过程接中数据将被“轮”多少次”（1）释义：训练过程中当一个完整的数据集通过了神经网络一次并且返回了一次，这个过程称为一个epoch，网络会在每个epoch结束时报告关于模型学习进度的调试信息。（2）为什么要训练多个epoch，即数据要被“轮”多次在神经网络中传递完整的数据集一次是不够的，对于有限的...

2019-04-23 10:56:57 13267 3

原创语音唤醒

唤醒可以看成是一种小资源的关键词检索任务，其中小资源是指计算资源比较小和空间存储资源比较小，因此它的系统框架跟关键词检索的系统会有一定的区别，目前常用的系统框架主要有Keyword/Filler Hidden Markov Model System和Deep KWS System两种。第一种被称为基于HMM的Keyword and Filler系统，这类系统的关键是上图中左...

2019-04-22 19:51:16 11463

转载 keras搭建LSTM处理可变长序列

众所周知，LSTM的一大优势就是其能够处理变长序列。而在使用keras搭建模型时，如果直接使用LSTM层作为网络输入的第一层，需要指定输入的大小。如果需要使用变长序列，那么，只需要在LSTM层前加一个Masking层，或者embedding层即可。 1 2 3 4 5 fromkeras.layersimportMasking,...

2019-04-20 11:57:57 2371

原创 tensorflow从checkpoint中提取模型从参数

2019-04-13 11:40:17 1242

原创 tensorflow从pb文件导出模型图

运行下面的程序，将graph信心保存在log目录：#!/usr/bin/env python# -*- coding:utf-8 -*-import tensorflow as tffrom tensorflow.python.platform import gfilemodel = 'model.pb' #请将这里的pb文件路径改为自己的graph = tf.get_default...

2019-04-13 10:46:26 1108

转载 kaldi训练mono-phone——强制对齐

kaldi中训练声学模型，首先是训练单音素模型，即mono-phone过程，本文主要讲述mono-phone训练的过程。代码为steps/train_mono.sh用法如下所示：steps/train_mono.sh [options] <training-data-dir> <lang-dir> <exp-dir>training-data...

2019-04-10 14:39:12 3206 1

原创 kaldi运行timit

1、下载timit数据，将数据解压在egs/timit/data 目录下2、打开s5目录，编辑run.sh 如下（根据timit数据存放的目录修改）：echo ============================================================================echo " Data & Lexico...

2019-04-09 20:07:35 1074 1