自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 Error: utils/validate_data_dir.sh: file data/sre/utt2spk is not in sorted order or has duplicates

之前也遇到过,就是没有排序或者是有重复的,加一个 sort -u 就好了。但是今天这个错误和另一个错误交替出现,调了两个多小时,差点砸笔记本了,还有一个错误是: Error : ” utt2spk is not in sorted order when sorted first on speaker-id fix this by making speaker-ids prefixes of

2016-10-25 00:32:31 6299 3

原创 python的join函数

做数据预处理时遇到一个问题,就是如何把一个list的元素用一个特殊符号连接起来,当然可以用for循环,看起来比较麻烦。 b = ['American', 'Avocet', '2', 'individual'] s = '_' spk_name = s.join(b) print spk_name #结果是 'American_Avocet_2_individ

2016-10-25 00:20:00 439

原创 音频信号中采样率和比特率以及采样编码的问题

采样率和比特率:cmd: soxi aa.mp3Input File : 'aa.mp3'Channels : 1 Sample Rate : 44100 Precision : 16-bitDuration : 00:01:11.95 = 3172951 samples = 5396.18 CDDA sectorsFile Size

2016-10-23 15:40:18 4971

原创 Kaldi中的plda的训练以及computer-socre

最近一直有个疑惑,plda是怎么训练的?就是plda是怎么计算得分的? 又是怎么根据得分进行判断说话人的? EER跟准确率之间又是什么关系? 时间很紧,论文还没写,需要静一静,好好弄明白这个来清醒一下。 提取完i-vector之后,计算出每一句话的ivector特征,然后计算了sreivector-mean scp:exp/ivectors_sre/ivector.scp exp/ivector

2016-10-16 23:37:32 9641 1

原创 LDA(线性判别式分析)以及与PCA降维之间的区别

reference: http://blog.csdn.net/warmyellow/article/details/5454943首先说一下协方差矩阵, 之前大家肯定都学过,忘了的可以稍微看一眼:LDA是多个类的之前的判别,一个类之间的数据我们可以用方差或者标准差,但是多个类之间显然不能再用var or std-var,  这时候就要用到cov.协方差: cov(X, Y

2016-10-12 14:51:00 9843

原创 kaldi工具:est-pca 和 paste-feats

感觉kaldi的一些工具的说明不是很详细,经常会用错,这就需要看看相近的几个命令都尝试一下。 我现在有一个需求: 需要把128维的bottleneck features 用PCA降到26维,然后再把这26维与之前的fbank的特征做一个拼接,生成每一帧都是26+26=52维的特征,yeah, 这就是tandem-feature. 现在bottleneck feature已经okay了(这一步其实

2016-10-06 18:22:23 2207 1

原创 DTW(一)

reference: http://blog.csdn.net/zouxy09/article/details/9140207 http://www.cnblogs.com/tornadomeet/archive/2012/03/23/2413363.html http://www.fon.hum.uva.nl/david/ba

2016-10-05 15:58:20 1356

原创 DBN+DNN的结构问题(含bottleneck)

假期之前遇到一个问题一直在困扰着我,先用DBN做pretrain的时候,那么DNN的层数以及每层的结构该怎么设计呢?匆匆忙忙的三四天假期结束了,先解决一下这个问题。先来看一下,之前做的一个wsj的一个demo,用的原始的配置: hidlayers=2 hiddims=512 #训练dbn的脚本,两层的RBM 隐层维数是512 steps/nnet/pretrain_dbn.sh --r

2016-10-03 19:04:00 5231

mysql中文手册

很好的中文学习手册,平时没事多看看手册,mysql还是不难的

2013-06-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除