用于改进说话人验证的对比混合学习

最新推荐文章于 2025-01-20 14:26:37 发布

深海的银

最新推荐文章于 2025-01-20 14:26:37 发布

阅读量283

点赞数

分类专栏： ICASSP 2022 文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_44543298/article/details/128643881

版权

ICASSP 2022 专栏收录该内容

8 篇文章

订阅专栏

CONTRASTIVE-MIXUP LEARNING FOR IMPROVED SPEAKER VERIFICATION

摘要

本文提出了一种全新的mixup原型损失；

mixup是一种简单高效的数据增强方法--可以制造随机数据点和标签对的加权组合；

mixup在深度学习中可以提升模型的鲁棒性和泛化能力；

尽管mixup已经在很多领域成功应用，但绝大多数都是闭集的分类任务；

本文提出contrastive-mixup,这是一种新奇的数据增强策略--可以学到基于distance metric的具有区分性的representation；

在训练中，mixup可以对输入和虚拟标签生成convex interpolations（凸插值），另外，本文重新阐述了prototypical loss，证明mixup适用于度量学习目标；

本文在少量数据上验证了其泛化能力，相较于baseline有16%的提升；

Index Terms：mixup、度量学习、prototypical loss

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

深海的银

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

MATLAB算法实战应用案例精讲-【人工智能】对比学习（概念篇）（补充篇）

qq_36130719的博客

05-05

2431

自监督学习（Self-supervised learning）最近获得了很多关注，因为其可以避免对数据集进行大量的标签标注。它可以把自己定义的伪标签当作训练的信号，然后把学习到的表示（representation）用作下游任务里。最近，对比学习被当作自监督学习中一个非常重要的一部分，被广泛运用在计算机视觉、自然语言处理等领域。它的目标是：将一个样本的不同的、增强过的新样本们在嵌入空间中尽可能地近，然后让不同的样本之间尽可能地远。在2014年生成对抗网络（GAN）推出之后，生成模型得到了很多关注。

python声纹识别_声纹识别（说话人识别）

weixin_39662611的博客

12-08

8514

声纹识别声纹识别，生物识别技术的一种，也称为说话人识别，有两类，即说话人辨认和说话人确认。声纹识别的理论基础是每一个声音都具有独特的特征，通过该特征能将不同人的声音进行有效的区分。声音特征1、语音的特殊性。发音器官分为声门上系统、喉系统、声门下系统，每个人都有自己的一套发音器官，它们的形态、构造各有差别，每次发音需要众多发音器官相互配合、共同运动。这决定了语音的物理属性(也称语音四要素)：音质、音...

参与评论您还未登录，请先登录后发表或查看评论

深度对比学习综述

如果想成为中心，那么就到中心去吧。

01-10

2021

在深度学习中, 如何利用大量、易获取的无标注数据增强神经网络模型的特征表达能力, 是一个具有重要意义的研究问题, 而对比学习是解决该问题的有效方法之一, 近年来得到了学术界的广泛关注, 涌现出一大批新的研究方法和成果. 本文综合考察对比学习近年的发展和进步, 提出一种新的面向对比学习的归类方法, 该方法将现有对比学习方法归纳为5类, 包括: 1) 样本对构造;2) 图像增广;3) 网络架构;4) 损失函数;

对比学习爆火！与时间序列结合轻松登顶NIPS!

最新发布

Aimoxin111的博客

01-20

874

AI科研灵感致力于成为您在人工智能领域的领航者，定期更新人工智能领域的重大新闻与最新动态，和您一起探索AI的无限可能。立即关注我们，开启您的AI学习之旅！

A Survey on Mixup Augmentations and Beyond——Mixup增强方法及其应用综述

Together_CZ的博客

12-19

1552

A Survey on Mixup Augmentations and Beyond——Mixup增强方法及其应用综述

Multimodal Contrastive Training for Visual Representation Learning

strange_aa的博客

07-15

1258

视觉表示学习的多模态对比训练 paper: https://arxiv.org/pdf/2104.12836v1.pdf code: 暂无摘要我们开发一种学习视觉表示的方法，该方法包含多模态数据，并结合了模态内部和模态间相似性保存目标。与在单个域中解决代理预测任务的现有视觉预训练方法不同，我们的方法同时利用每个模态和语义信息中的内在数据属性，从而提高所学视觉表示的质量。通过将多模态训练包含在具有不同类型对比损失的统一框架中，我们的方法可以学习更强大和通用的视觉特征。我们首先对 COCO 模型进行训练，

深度笔记 - Moco对比式学习（Momentum Contrast for Unsupervised Visual Representation Learning）

参谋谋的博客

12-29

3049

一些废话：之前读完了MAE，对自监督学习有了新的认知。当初在看半监督学习时，发现MeanTeacher、semiGan也好，蒸馏学习也好，其实多多少少采用了相似的思想。而恺明大佬在MAE中对NLP任务和CV任务的分析与探讨也让人感受很深，首先有些方法不一定非常新颖，但如何得出这个方法，这个思考过程，是非常重要的。概述 2017年，FAIR提出的Moco不仅逼近、甚至超越了部分有监督视觉任务的预训练模型。自监督学习可以粗略分为：基于上下文、基于对比的、基于时序这三种。入门可以阅读这篇博客：自监

基于高斯混合模型（GMM）的说话人识别实验.rar

08-09

总的来说，基于高斯混合模型的说话人识别是一个涉及音频处理、统计建模和机器学习的综合性问题。通过理解GMM的工作原理，以及优化实验流程，我们可以有效地提高说话人识别的性能。在实验中，不断调整模型参数、改进...

时变Fbank加权MFCC提升基于i向量的说话人验证性能研究

最后，文章可能展示了实验结果，对比了传统方法与改进的时变Fbank加权MFCC-i向量方法在说话人验证任务上的性能提升，证明了该方法在实际应用中的有效性。总结来说，这篇研究论文深入探讨了如何利用时变Fbank加权...

基于GMM的说话人识别

03-22

此外，针对说话人确认系统，文章提出了一种改进的归一化背景模型方法，旨在提高系统的准确性。这种方法通过优化冒充者模型来降低等错率，从而提高整个系统的鲁棒性和可靠性。 #### 结论与未来展望综上所述，基于...

Co-Mixup:PyTorch正式实施“ Co-Mixup

03-22

混合混合：具有超模块化多样性的显着性联合混合这是ICLR'21口头接受的“ Co-Mixup：显着性联合超模量联合混合代码”（）。部分代码是从Puzzle Mix（）中借用的。引用这项工作 @inproceedings{ kim2021comixup, title={Co-Mixup: Saliency Guided Joint Mixup with Supermodular Diversity}, author={JangHyun Kim and Wonho Choo and Hosan Jeong and Hyun Oh Song}, booktitle={International Conference on Learning Representations}, year={2021} } 要求此代码已经过测试python 3.7.6 pytorch 1.7.0 火炬视觉0.

读论文Momentum Contrast for Unsupervised Visual Representation Learning 简单总结

lzw刘仔很忙的博客

02-20

761

简介我们提出了无监督视觉表示学习的动量对比（MoCo）。从对比学习作为词典查找的角度出发，我们构建了一个带有队列和momentum-based moving average编码器的动态词典。这使得能够快速构建一个大型且一致的词典，从而促进对比无监督学习。MoCo在ImageNet分类的共同线性协议下提供竞争性结果。更重要的是，MoCo学习到的表示可以很好地转移到下游任务。在PASCAL-VOC、COCO和其他数据集上，MoCo可以在7个检测/分割任务上取得很好地效果，有时甚至超过了有监督学习。这表明，在

元学习-Prototypical Network的解析

weixin_45994963的博客

11-03

979

元学习顾名思义是使网络具备自主学习能力，能像人一样具备学习能力，通过看到少量的样本就可以去区分识别更多的样本，对于现在很多较难获取样本的场景具有优越性。

SC-GlowTTS论文阅读

zzfive的博客

10-29

1057

SC-GlowTTS论文阅读

Kaiyuan_sjtu的博客

09-18

4086

牛津大学最新 | LUMix：Mixup改进版，几行代码轻松涨点！

CV_Autobot的博客

12-21

1121

点击下方卡片，关注“自动驾驶之心”公众号ADAS巨卷干货，即可获取点击进入→自动驾驶之心【目标检测】技术交流群后台回复【LUMix】获取论文！！！摘要当使用噪声样本和正则化技术进行训练时，现代深度网络可以更好地泛化。Mixup[41]和CutMix[39]已被证明对数据增强有效，有助于避免过拟合。基于先前Mixup的方法线性地组合图像和标签以生成额外的训练数据。然而，如果目标没有占据整个图像，这是...

【论文学习】mixup系列（mixup、cutMix、manifold mixup、patchUp、saliencyMix、puzzleMix、co-Mixup、FMix）