基于群适应融合网络提高说话人验证的公平性

IMPROVING FAIRNESS IN SPEAKER VERIFICATION VIA GROUP-ADAPTED FUSION NETWORK

摘要

  1. 现在的说话人验证系统,在训练中,SV网络通常将区分任意说话人当作优化目标。这种学习过程会使得学习优良的声音特征向主要speaker群体发生偏差,这会导致不同群体之间不公平的性能差异;

  1. 这种情况在具有相似声音特征的代表性不足的人口群体中尤其明显;

  1. 本文通过在特制数据集(不平衡的性别分布)中得到直接的证据:模型表现受到代表性不足群体的影响;

  1. 为了减少这种差异,本文提出了group-adapted fusion network--一个基于group ebmedding适应和分数融合的组合结构;

  1. 本模型减轻了模型的不公平通过在全体/单独群都提高了SV表现

Index Terms:群speaker分布不均、embedding adaptation、score fusion

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值