monsieurliaxiamen-CSDN博客

原创 kaldi基础介绍（一）在说话人识别中的数据准备

在kaldi说话人识别示例（egs/sre10,egs/sre16）中，数据总共有两大类，一是训练集（training），二是评估数据集（evaluation）。对于评估数据集又分为两类，一是用来注册（enrollment）的数据集，二是测试（test）集。一、训练集的准备训练集需要准备的文本文件是三类：spk2utt, utt2spk以及wav.scp1 spk2utt 是说话人id（记作spk...

2018-04-03 12:02:32 7605 4

原创基于x-vector的文本无关说话人识别

这篇文章分两部分，第一部分介绍x-vector的说话人识别细节算法，第二部分是对最新技术的跟进，本质是对训练数据做了data augmentation，x-vector方法在kaldi上的实现细节将在下一篇文章中展示。一 . 对文章“Deep neural network embeddings for text-independent speaker verification” 的解读。1. 概要...

2018-03-21 12:36:28 16839 15

原创开篇计划

这个帐号是2017年在厦门实习的时候申请的，由于种种原因我申请不了新的帐号，所以只能使用这个帐号。这段时间刚开始实习，从现在开始要学习的很多，也打算把学到的知识记录下来。一是说不定可以和别人交流交流技术；二呢，俗话说好记性不如烂笔头，通过自己写的总结和心得，可以加深对知识的理解；三呢，这可以作为一种反馈机制敦促我的学习文章打算分五个分支，一是语音信号处理分支，这个估计暂时没时间就先写一丢；...

2018-03-21 11:41:02 366

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 kaldi基础介绍（一）在说话人识别中的数据准备

原创 基于x-vector的文本无关说话人识别

原创 开篇计划

空空如也

空空如也

原创基于x-vector的文本无关说话人识别

原创开篇计划