自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Rabbit Hole

Alice in Wonderland

原创 KALDI中ivector提取过程

1. 生成 wav.scp,spk2utt,utt2spk ./local/data_prep.sh /home/yixin/kaldi/egs/clarinet/data/clarinet_audio/wav /home/yixin/kaldi/egs/clarinet/data/clari...

2019-05-13 15:02:03

阅读数 329

评论数 0

原创 将特征文件导入kaldi格式转换

将txt转成ark格式: ~/kaldi/src/featbin/copy-feats ark,t:train.txt ark:train.ark txt转化为ark 查看ark文件: ~/kaldi/src/featbin/copy-feats ark:r...

2019-04-30 09:44:25

阅读数 46

评论数 0

转载 Kaldi中特征文件格式的转换

1、kaldi中的ark文件与htk中的mfcc文件的互相转换 (1)、ark转mfcc 使用底层命令copy-feats-to-htk Save features as HTK files: 每个发音会转化为一个对应的htk格式的特征文件,后缀可以自己定义 用法...

2019-04-16 18:30:07

阅读数 86

评论数 0

原创 kaldi 用ivector计算plda出错

运行结果如下: ===== FEATURES EXTRACTION ===== steps/make_mfcc.sh --cmd run.pl --nj 1 data/train exp/make_mfcc/train mfcc steps/make_mfcc.sh: moving dat...

2019-04-13 21:53:41

阅读数 209

评论数 2

转载 Kaldi 查看不同文件用到的命令

* 1.ark,scp文件 ~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|head ark存的试二进制文件,scp可以直接用cat命令看。 *2.fst文件 ~/kaldi/tools/openfst-1.6.2...

2019-04-13 20:18:29

阅读数 38

评论数 0

原创 声纹识别笔记(二)ivector PLDA 以及最新模型

GMM-UBM GMM:均值、方差、权重 UBM:共性特征 i-vector MAP说话人自适应 m:UBM的均值(已知) s:把UBM针对特定说话人调整成GMM,GMM的均值(通过特征得到) T:训练得到 w:特定说话人的ivector 一般只更新均值,不更新方差 D...

2019-04-11 22:25:52

阅读数 176

评论数 0

原创 声纹识别笔记(一)实验平台 特征 神经网络

发展源流: GMM -- ivector -- DNN 背景介绍 评价指标 设置一个阈值,高于这个阈值的为True,低于则不接受 用softmax输出一个概率Accuracy,则EER ~(1-ACC)/2。 e.g. Accuracy = 80% EER = (1-0.8)/2 ...

2019-04-11 21:34:03

阅读数 115

评论数 0

原创 kaldi中声纹识别ivector模型

1.数据准备:无论使用kaldi来做语音识别还是说话人识别,第一步就是数据准备,对于说话人识别来说,需要准备的几个文件为wav.scp,utt2spk,spk2utt这三个文件。对应的格式如下: 1.1 wav.scp有两列,第一列是key,这个可以一定要唯一;第二列是 wav的路径wavp...

2019-04-11 17:03:15

阅读数 685

评论数 0

原创 Kaldi在compute-vad-decision时,无法生成vad.scp

问题描述:在compute-vad-decision时,无法生成vad.scp,查看log中写到:compute-vad: command not found。 Log中: 解决方法:在path.sh中加入$KALDI_ROOT/src/ivectorbin/ 解决思路: 找不...

2019-04-10 12:47:28

阅读数 53

评论数 0

原创 Kaldi 运行报错:fix_data_dir.sh: no utterances remained: not proceeding further.

The fix_data_dir.sh script eliminates some utterances if something is missing from one of the files needed (e.g. text, feats.scp, wav.scp) so if you ...

2019-04-09 16:49:06

阅读数 164

评论数 0

原创 实用排序算法整理(Python)

一、冒泡排序 (稳定) def bubble_sort(nums): #n^2 1 n = len(nums) for i in range(n): for j in range(n-2,i-1,-1): if nums[j]&...

2019-03-29 23:11:06

阅读数 19

评论数 0

原创 快速排序 升序要从右开始的原因

基数选在左边 也就是6 正确:从右往左选小的,从左往右选大的交换 从右选到2,从左碰到i=j,所以交换26,->21679 错误:从左往右选大的,从右往左选小的 从右选到7,从左没有比6小的,碰到i=j,交换67,->71269 出错! 所以要从右边开始,...

2019-03-28 23:38:38

阅读数 56

评论数 0

原创 Python - TypeError: object of type 'NoneType' has no len() 解决方法

定义的函数没有返回值,加上返回值即可 参考:https://stackoverflow.com/questions/48096547/python-typeerror-object-of-type-nonetype-has-no-len

2019-03-28 11:18:58

阅读数 1666

评论数 0

翻译 法扎 L'assasymphonie

L'assasymphonie 杀人交响曲 Cette nuit 昨夜 Intenable insomnie 辗转无眠 La folie me guette 癫狂已窥伺许久 Je suis ce que je fuis 我逃离了我自己 Je subis 我忍受着 Cette cacophoni...

2019-03-26 17:25:54

阅读数 76

评论数 0

原创 Kaldi计算MFCC报错:kaldi WaveData: unsupported bits_per_sample=24

原因: kaldi不支持24位深 解决方法:利用sox工具写个脚本将音频文件的位深改成16 sox工具的使用见: https://blog.csdn.net/veritasalice/article/details/88634987

2019-03-18 11:32:47

阅读数 84

评论数 0

原创 SOX命令:音频位深度、采样率以及码率

(一)位深度(bit-per-sample)。位深度也叫采样位深,音频的位深度决定动态范围。 我们常见的16Bit(16比特),可以记录大概96分贝的动态范围。那么,您可以大概知道,每一个比特大约可以记录6分贝的声音。同理,20Bit可记录的动态范围大概就是120dB;24Bit就大概是144d...

2019-03-18 11:23:30

阅读数 641

评论数 0

转载 计算机网络基础

原文:https://blog.csdn.net/mountain_hua/article/details/82721369 计算机网络 基础 Q:五层协议的体系结构分别是什么?每一层都有哪些协议? https://blog.csdn.net/cainv89/article/detail...

2019-03-14 15:43:51

阅读数 15

评论数 0

原创 数据结构整理之线性表

数组(顺序存储结构) 链表 一个结点由存放数据元素的数据域和存放后继结点地址的指针域组成。 头结点的数据域可以不存放任何信息,其指针域存储指向第一个结点的指针。 链表的一个结点p,其储存的数据为p->data. 链表的创建、插入、删除 插入: ...

2019-03-13 23:03:33

阅读数 12

评论数 0

原创 算法空间复杂度学习笔记

算法的空间复杂度为运行算法所需的储存空间的大小S(n)=O(f(n)),是关于问题规模n所占储存空间的函数。 是时间换空间,还是空间换时间,要看具体的要求。 如果要求不增加空间开销,原地进行操作,则空间复杂度为O(1)。 只要不是特别大的内存开销,时间复杂度更加重要。 因为用户更加关心速...

2019-03-12 17:41:24

阅读数 37

评论数 0

原创 算法时间复杂度学习笔记

算法的时间复杂度为语句总的执行次数,记作T(n) = O(f(n)) 是关于问题规模n的函数。 常数阶O(1):顺序结构,分支结构 线性阶O(n):一个循环 对数阶O(logn):二分查找 平方阶O(): 循环嵌套 P.S.常见的时间复杂度 常数阶O(1):顺序结构,分支结构 ...

2019-03-12 17:26:31

阅读数 19

评论数 0

提示
确定要删除当前文章?
取消 删除