基于群适应融合网络提高说话人验证的公平性

最新推荐文章于 2024-10-24 23:59:02 发布

深海的银

最新推荐文章于 2024-10-24 23:59:02 发布

阅读量115

点赞数

分类专栏： ICASSP 2022 文章标签：深度学习 Powered by 金山文档

本文链接：https://blog.csdn.net/weixin_44543298/article/details/128645099

版权

ICASSP 2022 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

IMPROVING FAIRNESS IN SPEAKER VERIFICATION VIA GROUP-ADAPTED FUSION NETWORK

摘要

现在的说话人验证系统，在训练中，SV网络通常将区分任意说话人当作优化目标。这种学习过程会使得学习优良的声音特征向主要speaker群体发生偏差，这会导致不同群体之间不公平的性能差异；

这种情况在具有相似声音特征的代表性不足的人口群体中尤其明显；

本文通过在特制数据集（不平衡的性别分布）中得到直接的证据：模型表现受到代表性不足群体的影响；

为了减少这种差异，本文提出了group-adapted fusion network--一个基于group ebmedding适应和分数融合的组合结构；

本模型减轻了模型的不公平通过在全体/单独群都提高了SV表现

Index Terms：群speaker分布不均、embedding adaptation、score fusion

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

深海的银

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

AI人工智能深度学习算法：神经网络的复杂性与能力

AI架构设计之禅

07-07

999

人工智能（AI）领域在过去十年中取得了巨大的进展，其中深度学习算法和神经网络模型扮演了关键角色。神经网络，作为深度学习的核心组件，以其强大的学习能力和灵活的结构，在各种复杂任务中展现出惊人的性能。然而，随着神经网络模型变得越来越复杂，其内部机制和能力边界也变得愈发难以理解和预测。本文将深入探讨神经网络的复杂性及其所带来的强大能力，剖析其背后的原理，并探讨其在现实世界中的应用及未来发展趋势。神经网络的核心原理是模拟人脑的神经元结构和信息处理方式。

AI系统架构原理与代码实战案例讲解

AI天才研究院

08-10

489

人工智能的概念可以追溯到上世纪50年代，图灵测试的提出标志着人工智能作为一门学科的诞生。早期的研究主要集中在符号推理、专家系统等领域，取得了一些突破，例如机器定理证明、西洋跳棋程序等。上世纪80年代，随着专家系统的兴起，人工智能进入了一个黄金时期。专家系统通过模拟人类专家的知识和经验进行推理和决策，在医疗诊断、故障诊断等领域取得了成功应用。进入90年代，由于计算能力的限制和数据量的不足，人工智能的发展陷入低谷。近年来，随着深度学习技术的突破、大数据的兴起以及计算能力的提升，人工智能迎来了第三次发展浪潮，在图

参与评论您还未登录，请先登录后发表或查看评论

2024考研408-计算机网络第三章-数据链路层学习笔记

每个人都是独一无二的，把握好自己的节奏，跟着自己的心走。

08-03

5601

过程：主机A向主机B发送数据，发送方会在对应的数据在每一层会加上相应的控制信息进行封装，之后传输出去，经过中间系统时也会经历解封、封装过程，最终传输到主机B通过解封来取得其中的数据。上图的话可以看到数据是自上而下先封装之后自下而上再解封，当专门只研究数据链路层问题时，我们只关心协议栈的水平方向的各个数据链路层，如下图的箭头所示，这就是这一张研究链路层的一个研究思想。功能概述：数据链路层在物理层提高服务的基础上向网络层提供服务，其最基本的服务是将源自网络层来的数据可靠地传输到相邻节点的目标机的网络层。

章鱼网络，构建未来Web3弹性之网

OctopusNetwork的博客

10-07

712

全长8698字，预计阅读23分钟嘉宾：刘毅撰文：MiX 微信交流：mixcross919 章鱼网络的愿景：大幅降低Web3.0应用链（ Appchain ）的启动、运行和创新门槛，将启动应用链的成本从几百万美金降低到几万美金。只有把门槛降得足够低，才能让大量创业者参与进 Web3.0 应用创新，才能让 Web3.0 更快落地、更快走向主流。 NO.1 刘毅老师是 Web3.0 的坚定倡导者，你最希望传递的Web3.0核心要点有哪些？我想传递核心要点有3个： ...

计算机网络【王道】

不依法度的博客

03-08

3506

计算机网络

王道计算机网络

yi_chen_c的博客

09-18

6466

网络体系结构是从功能上描述计算机网络结构计算机网络体系结构简称网络体系结构是分层结构每层遵循某个/些网络协议以完成本层功能计算机网络体系结构是计算机网络的各层及其协议的集合第n层在向n+1层提供服务时，此服务不仅包含第n层本身的功能，还包括由下层服务提供的功能仅仅在相邻层间有接口，且所提供服务的具体实现细节对上一层完全屏蔽1.通信基础2.俩个公式3.看图说话4.传输介质5.物理层设备1.链路层的功能2.链路层的两种信道3.局域网、广域网4.链路层的设备结点：主机、路由器。

一篇学完：王道考研408计算机网络（全）

qq_35787977的博客

06-19

7289

王道考研408计算机网络全程

计算机网络学习笔记

热门推荐

赵宸的博客

09-05

1万+

计算机网络学习笔记第一章计算机网络体系结构 1.1 计算机网络概述 1.1.1 计算机网络的概念计算机网络：是一个将分散的，具有独立功能的计算机系统，通过通信设备与线路连接起来，由功能完善的软件实现资源共享和信息传递的系统。计算机网络是个互联的，自治的计算机集合。互联-通过通信链路互联互通自治-无主从关系 1.1.2 计算机网络的组成 1.组成部分：硬件，软件，协议（一系列规则和约定的集合） 2.工作方式用户直接使用 c/s方式 client/server b/s方式 browser/se

AutoML系列 | 03-神经网络架构搜索(NAS)综述

JDDTechTalk的博客

10-12

2553

本文是对 “Neural Architecture Search: A Survey”的翻译，这篇Paper 很好的总结分析了 NAS 这一领域的研究进展。摘要在过去几年中，深度学习在各种任务上(例如图像识别，语音识别和机器翻译)取得了显著进步。这一进步的关键方面之一是新颖的神经架构。目前使用的架构大多是由人类专家开发设计的，这是一个耗时且容易出错的过程。因此，人们对自动神经网络搜索方法越来越感兴趣。本文概述了该研究领域的现有工作，并根据搜索空间、搜索策略和性能评估策略三个维度对其进行了分类。一.

多模态分配下的主动说话人检测

265MAAS：用于主动说话人检测的多模态分配Juan Le o'n Alc a'zar1，Fabian Caba Heilbron2，Ali K.Thabet1 Bernard Ghanem11阿卜杜拉国王科技大学（KAUST），2Adobe Researchjc. uniandes.edu.co，caba@adobe.com，...

基于多级注意网络的视觉问题分类

提出了一种基于图像的与基于文本的问答相比，视觉领域的问答更具有挑战性，因为视觉领域的推理过程需要有效的语义嵌入和细粒度的视觉理解。现有的方法主要从抽象的低层视觉特征中推断答案为了解决这些问题，我们提出...

联邦学习：基于自我注意力的架构对异构设备间的联邦学习具有鲁棒性，提高模型表现

摘要联合学习是一种新兴的研究范式，可以在不同组织之间协作训练机器学习模型，同时保持每个机构的数据私密性尽管最近取得了进展，但仍然存在基本挑战，例如缺乏融合以及在现实世界的异构设备之间发生灾难性遗忘的...

粒度音频视觉控制下的表情说话人生成

Borong Liang1*Yan Pan2,3*Zhizhi Guo1†Hang Zhou1†Zhibin Hong1Xiaoguang Han2,3Junyu Han1...{yanpan@link.,hanxiaoguang@}cuhk.edu.cn.33870具有粒度音频视觉控制的表情说话人生成01 百度公司计算机视觉技术部

基于时空融合的唇读方法的改进与实现

713基于时空融合的卷积序列唇读Xingxuan Zhang，Feng Cheng，ShilinWang* 上海交通大学中国上海xingxuanzhang@...为了很好地解决这些缺点，我们提出了一个时间焦点块，以充分描述短距离的依赖性和时空融合模块（STF

从0开始深度学习（19）——参数管理

立志成为炼丹师？

10-24

1287

w∼U510可能性140可能性12U−10−5可能性14U(5, 10) & \text{ 可能性 } \frac{1}{4} \\0 & \text{ 可能性 } \frac{1}{2} \\U(-10, -5) & \text{ 可能性 } \frac{1}{4}w∼⎩⎨⎧U5100U−10−5可能性41可能性21可能性41w从均匀分布U510中取值。

基于深度学习的音乐生成与风格转换

最新发布

weixin_42605076的博客

10-24

1167

音乐风格通常由节奏、和声、旋律、乐器编制、音色等要素决定。风格转换的核心在于保持音乐作品的核心旋律、节奏或主题不变的前提下，调整其和声、伴奏模式或音色以适应目标风格。基于深度学习的音乐生成与风格转换技术具有广泛的应用潜力，不仅能够自动创作出新颖的音乐作品，还可以实现不同风格之间的无缝转换。随着模型性能的不断提升和应用场景的扩展，这一领域将在未来为音乐创作、娱乐和教育等领域带来更多的创新与变革。

ADAMG——深度学习无参数优化的新时代

知来者逆的博客

10-24

676

黄金步长的引入是为了在保持 AdaGrad-Norm 收敛性能的同时，接近预期的最佳步长。这种步长与具体问题的特征无关，有望在各种训练条件下促进一致有效的收敛（见图 1）。ADAMG 是一种基于 AdaGrad-Norm 的无参数优化算法，它使用黄金步长为各种优化任务自动提供最佳学习率。实验结果表明，与传统优化方法相比，ADAMG 具有更高的稳定性和效率。特别是在计算资源有限或处理大型数据集的情况下，该算法可以有效地保持高性能，同时减少人工调整的工作量。

【进阶OpenCV】（21） --卷积神经网络实现人脸检测

m0_74896766的博客

10-21

768

本篇介绍了如何通过使用dlib库中的卷积神经网络（CNN）人脸检测模型来检测一张图片中的人脸。注意！！：为例减少模型的计算，使用加载的CNN人脸检测模型对图片进行人脸检测时，上采样次数可以少一点。

从0开始深度学习（20）——延后初始化和自定义层

立志成为炼丹师？

10-24

510

我们构造一个没有任何参数的自定义层，下面的CenteredLayer类要从其输入中减去均值。要构建它，我们只需继承基础层类并实现前向传播功能。传入一些数据进行验证现在，我们可以将层作为组件合并到更复杂的模型中。作为额外的健全性检查，我们可以在向该网络发送随机数据后，检查均值是否为0。由于我们处理的是浮点数，因为存储精度的原因，我们仍然可能会看到一个非常小的非零数。Y.mean()

神经网络融合链路预测算法：提升精度与适应性

"基于神经网络的链路预测算法是为了解决传统基于网络拓扑结构相似性的链路预测方法存在的精度低和适应性差的问题。该算法通过融合多种相似性指标，利用神经网络学习这些指标的数值特征，并结合标准粒子群算法优化...