说话人识别
文章平均质量分 79
monsieurliaxiamen
语音识别 说话人识别
展开
-
基于x-vector的文本无关说话人识别
这篇文章分两部分,第一部分介绍x-vector的说话人识别细节算法,第二部分是对最新技术的跟进,本质是对训练数据做了data augmentation,x-vector方法在kaldi上的实现细节将在下一篇文章中展示。一 . 对文章“Deep neural network embeddings for text-independent speaker verification” 的解读。1. 概要...原创 2018-03-21 12:36:28 · 16864 阅读 · 15 评论 -
kaldi基础介绍(一)在说话人识别中的数据准备
在kaldi说话人识别示例(egs/sre10,egs/sre16)中,数据总共有两大类,一是训练集(training),二是评估数据集(evaluation)。对于评估数据集又分为两类,一是用来注册(enrollment)的数据集,二是测试(test)集。一、训练集的准备训练集需要准备的文本文件是三类:spk2utt, utt2spk以及wav.scp1 spk2utt 是说话人id(记作spk...原创 2018-04-03 12:02:32 · 7627 阅读 · 4 评论