SH-SSS丨《ISSD: 基于迭代式语音分离的说话人日志系统》论文线上分享

最新推荐文章于 2024-07-19 16:50:04 发布

语音之家

最新推荐文章于 2024-07-19 16:50:04 发布

阅读量543

点赞数 1

分类专栏： SH Symposium Series on Speech 文章标签：人工智能语音识别

本文链接：https://blog.csdn.net/weixin_48827824/article/details/127801819

版权

SH Symposium Series on Speech 专栏收录该内容

8 篇文章 1 订阅

订阅专栏

SH Symposium Series on Speech (SH SSS 2022)

SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。

来自AI语音技术领域的优秀论文作者、专家学者，用最精炼的表达来解读最新的高质量论文。

分享的论文成果来自国内外顶级会议收录的优秀文章、前沿学术报告。

主题 Tittle

ISSD: 基于迭代式语音分离的说话人日志系统

时间 Time

2022年11月15日 19:00 - 19:45

嘉宾 Author

牛树同：中国科学技术大学语音实验室博士研究生。主要研究方向为语音分离及说话人日志任务。合作文章曾发表于ICASSP、INTERSPEECH等语音领域会议。作为团队成员参加DIHARD III及DCASE 2022 Task 3等国际挑战赛并取得第一名。

概述 Abstract

本文提出了一种基于迭代式语音分离的说话人日志（Iterative separation-based speaker diarization, ISSD）方法来处理真实的测试数据。在ISSD方法中，我们根据说话人先验迭代地产生自适应数据来提高分离模型的泛化能力，这可以使得模型性能逐步提升。为了进一步减少说话人先验中一些不可避免的检测错误带来的影响，我们利用说话人的声纹信息提出了两种后处理方法，即说话人过滤以及说话人恢复。我们在真实的两人电话语音（Conversational telephone speech, CTS）上对提出的方法进行了测试。实验结果表明，与最先进的基于聚类的说话人日志系统（Clustering-based speaker diarization, CSD）相比，我们提出的方法在开发集和测试集上分别取得了47.72%和46.97%的相对提升。ISSD也是我们在DIHARD III挑战赛冠军系统中应用的一个关键技术。

题目 Tittle

中文：ISSD: 基于迭代式语音分离的说话人日志系统

英文：IMPROVING SEPARATION-BASED SPEAKER DIARIZATION VIA ITERATIVE MODEL REFINEMENT AND SPEAKER EMBEDDING BASED POST-PROCESSING

收录会议 Source Title

ICASSP 2022

作者 Authors

牛树同，杜俊，孙磊，李锦辉

论文地址 Url

https://ieeexplore.ieee.org/document/9746354

议程

Program Overview

时间

主题

嘉宾

19:00-19:30

ISSD: 基于迭代式语音分离的

说话人日志系统

牛树同

19:30-19:45

Q&A

参与方式

Joining

直播将通过语音之家微信视频号进行直播，手机端、PC端可同步观看。

语音之家

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SH-SSS丨《ISSD: 基于迭代式语音分离的说话人日志系统》论文线上分享

SH SSS 是由语音之家打造的AI语音技术相关的前沿论文成果分享平台。《ISSD: 基于迭代式语音分离的说话人日志系统》论文线上分享将于2022年11月15日19:00开始！
复制链接

扫一扫