自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 GPU Occupacy

定义: the ratio of the number of active warps per multiprocessor to the maximum number of possible active warps 每个多处理器上的活跃warps/最大可能warps的比值 percentage of the hardware's ability to process warps that ...

2019-05-14 18:56:24 252

原创 论文笔记

论文摘要P1:【说话人识别】 DEEP NEURAL NETWORKS FOR SMALL FOOTPRINT TEXT-DEPENDENTSPEAKER VERIFICATION 离线多说话人训练说话人区分网络 net,目标层为one-hot说话人矢量 利用net对enrollment的说话人语音进行计算,在多特征多语句上的最后隐层的平均作为说话人矢量d-vector d-vector进行cosi

2017-03-07 10:46:14 708

原创 3D音效-HRTF

最近VR比较火热,但聚焦点主要在视频方面。事实上音频对于VR的体验也十分重要。想象一下你在看VR电影的时候,来自不同方位的声音,是不是会更加增加临场感。 为什么我们的耳朵能够分辨出声音来自己与不同的方向。下面让我们来揭晓一下。 人们能够分辨出声音的远近,方向,主要与声波到达双耳的能量,时间和相位差等信息密切相关。把声音经介质到达人耳的路径可以看成一个滤波的过程,到达两个耳朵的声波在不同的角度是

2016-10-11 17:56:58 2343

原创 如何用kaldi训练好的DNN模型做在线识别

在已经训练好模型的情况下,需要针对一个新任务做在线识别应该怎么做呢? 一种情况是,用已有的声学模型和新训练的语言模型。 语言模型可以同srilm等工具训练,但是怎样将语言模型与DNN声学模型一起来进行识别的。 SRILM可以用来训练ARPA格式的LM,假设train.txt是语料,wordlist是词汇,假设语言模型的字典和识别器的字典一样,可以按如下办法训练LM ngram-coun

2016-10-11 17:46:55 8102 3

原创 端到端语音识别系统

本文主要观点来自于 google论文。 Towards End-to-EndSpeech RecognitionUsing Deep Neural Networks。 问题背景: 传统语音识别系统需要经过提特征,声学建模(state-phoneme-triphone),语言建模系列过程,其中声学建模需要对上下文相关的音素模型进行状态聚类,对每一帧特征需要做对齐。 端到端系统主要提出了下面的

2016-10-11 16:13:55 9154 1

原创 android NDK 编译 静态动态库

(1)配置Android.mk include $(BUILD_SHARED_LIBRARY) 编译静态库  include $(BUILD_STATIC_LIBRARY) 编译动态库 (2) 库的使用   使用动态库配置如下 include $(CLEAR_VARS) LOCAL_MODULE := Ne10 LOCAL_SRC_FILES := libNe10.so incl

2016-10-09 17:11:39 666

原创 数据处理memo

(1)  Data1(EST)  多处文件为空 (2) Data2(EST-2) windows转到linux下处理,需要利用dos2unix转化; 存在文本类别里面的?号在从gbk转utf8时,转码错误(f59 -> f65); (3) Data3 (corp) guangzhou shanghai的女声目录下存在error文件夹

2015-12-15 09:48:25 592

转载 【转载】Deep Learning方向的paper整理

Deep Learning方向的paper整理,分了几部分吧,但有些部分是有交叉或者内容重叠,也不必纠结于这属于DNN还是CNN之类,个人只是大致分了个类。目前只整理了部分,剩余部分还会持续更新。 一 RNN 1 Recurrent neural network based language model   RNN用在语言模型上的开山之作 2 Sta

2015-10-14 14:08:49 716

转载 【转载】Google研究员Ilya Sutskever:成功训练LDNN的13点建议

摘要:本文由Ilya Sutskever(Google研究员、深度学习泰斗Geoffrey Hinton的学生、DNNresearch联合创始人)所写,讲述了有关深度学习的见解及实用建议,包括深度学习为什么强大,如何强大,以及训练深度神经网络的tricks。 【编者按】本文由Ilya Sutskever(Google研究员、深度学习泰斗Geoffrey Hinton的学生、DNNre

2015-10-14 14:05:29 1121

原创 Linux命令

(1) vim字符串计数 %s/test/&/gn

2015-09-15 18:14:44 590

原创 Kaldi-Running the example scripts

(1) 特征: 提取:steps/make_mfcc.sh --nj 8 --cmd "run.pl" data/$x exp/make_mfcc/$x $featdir; 查看:copy-feats ark:$featdir/raw_mfcc_train.1.ark ark,t:- | head (2) 模型:    训练:steps/train_mono.sh --nj 4 --c

2015-08-24 10:34:24 1030

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除