GE2E Speaker Verification复现

今天正式开始研究基于深度学习的声纹识别。之前看过一点kaldi的关于声纹识别的代码,基本还是基于i-vector的,不得不说这是比较传统的,过时的方法。现在深度学习在声纹确认/识别上的优势比较明显。

GE2E Speaker Verification是Google的开源项目。

它的loss函数与之前的模型有些不同,利用区分训练方法,而且一批数据包含多个比较数据,提高了训练效率。

在此之前的Triple loss训练中,有一个Anchor数据,和一系列的正例、反例,目的是调整参数使得正例与Ground Truth更接近。

在GE2E方式中,一次输入多个说话人的多个语音,构成相似矩阵。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值