- 博客(3)
- 收藏
- 关注
原创 kaldi基础介绍(一)在说话人识别中的数据准备
在kaldi说话人识别示例(egs/sre10,egs/sre16)中,数据总共有两大类,一是训练集(training),二是评估数据集(evaluation)。对于评估数据集又分为两类,一是用来注册(enrollment)的数据集,二是测试(test)集。一、训练集的准备训练集需要准备的文本文件是三类:spk2utt, utt2spk以及wav.scp1 spk2utt 是说话人id(记作spk...
2018-04-03 12:02:32 7605 4
原创 基于x-vector的文本无关说话人识别
这篇文章分两部分,第一部分介绍x-vector的说话人识别细节算法,第二部分是对最新技术的跟进,本质是对训练数据做了data augmentation,x-vector方法在kaldi上的实现细节将在下一篇文章中展示。一 . 对文章“Deep neural network embeddings for text-independent speaker verification” 的解读。1. 概要...
2018-03-21 12:36:28 16839 15
原创 开篇计划
这个帐号是2017年在厦门实习的时候申请的,由于种种原因我申请不了新的帐号,所以只能使用这个帐号。这段时间刚开始实习,从现在开始要学习的很多,也打算把学到的知识记录下来。一是说不定可以和别人交流交流技术;二呢,俗话说好记性不如烂笔头,通过自己写的总结和心得,可以加深对知识的理解;三呢,这可以作为一种反馈机制敦促我的学习 文章打算分五个分支,一是语音信号处理分支,这个估计暂时没时间就先写一丢;...
2018-03-21 11:41:02 366
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人