自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 kaldi基础介绍(一)在说话人识别中的数据准备

在kaldi说话人识别示例(egs/sre10,egs/sre16)中,数据总共有两大类,一是训练集(training),二是评估数据集(evaluation)。对于评估数据集又分为两类,一是用来注册(enrollment)的数据集,二是测试(test)集。一、训练集的准备训练集需要准备的文本文件是三类:spk2utt, utt2spk以及wav.scp1 spk2utt 是说话人id(记作spk...

2018-04-03 12:02:32 7599 4

原创 基于x-vector的文本无关说话人识别

这篇文章分两部分,第一部分介绍x-vector的说话人识别细节算法,第二部分是对最新技术的跟进,本质是对训练数据做了data augmentation,x-vector方法在kaldi上的实现细节将在下一篇文章中展示。一 . 对文章“Deep neural network embeddings for text-independent speaker verification” 的解读。1. 概要...

2018-03-21 12:36:28 16838 15

原创 开篇计划

  这个帐号是2017年在厦门实习的时候申请的,由于种种原因我申请不了新的帐号,所以只能使用这个帐号。这段时间刚开始实习,从现在开始要学习的很多,也打算把学到的知识记录下来。一是说不定可以和别人交流交流技术;二呢,俗话说好记性不如烂笔头,通过自己写的总结和心得,可以加深对知识的理解;三呢,这可以作为一种反馈机制敦促我的学习  文章打算分五个分支,一是语音信号处理分支,这个估计暂时没时间就先写一丢;...

2018-03-21 11:41:02 364

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除