SH-SSS丨《ISSD: 基于迭代式语音分离的说话人日志系统》论文线上分享

SH Symposium Series on Speech (SH SSS 2022) 

SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。 

来自AI语音技术领域的优秀论文作者、专家学者,用最精炼的表达来解读最新的高质量论文。

分享的论文成果来自国内外顶级会议收录的优秀文章、前沿学术报告。

主题 Tittle

ISSD: 基于迭代式语音分离的说话人日志系统

时间 Time

2022年11月15日 19:00 - 19:45

嘉宾 Author

牛树同:中国科学技术大学语音实验室博士研究生。主要研究方向为语音分离及说话人日志任务。合作文章曾发表于ICASSP、INTERSPEECH等语音领域会议。作为团队成员参加DIHARD III及DCASE 2022 Task 3等国际挑战赛并取得第一名。

概述 Abstract

本文提出了一种基于迭代式语音分离的说话人日志(Iterative separation-based speaker diarization, ISSD)方法来处理真实的测试数据。在ISSD方法中,我们根据说话人先验迭代地产生自适应数据来提高分离模型的泛化能力,这可以使得模型性能逐步提升。为了进一步减少说话人先验中一些不可避免的检测错误带来的影响,我们利用说话人的声纹信息提出了两种后处理方法,即说话人过滤以及说话人恢复。我们在真实的两人电话语音(Conversational telephone speech, CTS)上对提出的方法进行了测试。实验结果表明,与最先进的基于聚类的说话人日志系统(Clustering-based speaker diarization, CSD)相比,我们提出的方法在开发集和测试集上分别取得了47.72%和46.97%的相对提升。ISSD也是我们在DIHARD III挑战赛冠军系统中应用的一个关键技术。

题 目 Tittle

中文:ISSD: 基于迭代式语音分离的说话人日志系统

英文:IMPROVING SEPARATION-BASED SPEAKER DIARIZATION VIA ITERATIVE MODEL REFINEMENT AND SPEAKER EMBEDDING BASED POST-PROCESSING

收录会议 Source Title

ICASSP 2022

作 者 Authors

牛树同,杜俊,孙磊,李锦辉

论文地址 Url

https://ieeexplore.ieee.org/document/9746354

议程

Program Overview

时间主题嘉宾
19:00-19:30

ISSD: 基于迭代式语音分离的

说话人日志系统

牛树同
19:30-19:45Q&A

参与方式

Joining

直播将通过语音之家微信视频号进行直播,手机端、PC端可同步观看。


  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值