Interspeech 2022丨FFSVC 2022 远场说话人识别比赛

最新推荐文章于 2022-12-05 15:43:45 发布

希尔贝壳AISHELL

最新推荐文章于 2022-12-05 15:43:45 发布

阅读量3.4k

点赞数

分类专栏：国际数据竞赛文章标签：语音识别人工智能

本文链接：https://blog.csdn.net/AI_SHELL/article/details/124378726

版权

国际数据竞赛专栏收录该内容

19 篇文章

订阅专栏

FFSVC2022是由昆山杜克大学等机构发起的远场说话人识别比赛，旨在评估技术在远场环境的表现。比赛包含全监督和半监督两个任务，提供新的训练、开发和测试数据集，允许使用VoxCeleb1&2数据集，但禁止使用其他语音数据集。参赛者需在Codalab平台上注册并提交结果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

近日，FFSVC 2022 远场说话人识别比赛已开放注册系统、提交系统和 Leaderboard，新的训练集/开发集/测试集已经发布。

官网：https://ffsvc.github.io/

01 背景

FFSVC 2022（Far-field speaker verification challenge 2022）是 Interspeech 2022 的 satellite events 之一，由昆山杜克大学、新加坡国立大学、南加州大学和希尔贝壳公司共同发起的远场说话人识别比赛。本次比赛的目的是检验当前说话人识别技术在远场环境下的性能，并促进这一领域的技术研究发展。FFSVC 2022 对所有个人和单位免费开放，做为 Interspeech 2022 的 satellite events，任何远场声纹识别相关的论文都被鼓励提交到我们的 workshop 中。

02 比赛信息

FFSVC 2020 在 Interspeech 2020 的成功举办表明越来越多的研究人员开始关注远场说话人验证任务。今年 FFSVC 2022 的挑战仍然集中在远场说话人验证任务上，并提供了一个新的开发和测试集。不同于 FFSVC 2020，新的测试集为远场单通道数据，包括手机和平板信道。为了减少训练集和测试集的数据不匹配，我们额外发布了针对 FFSVC 2020 的补充集，覆盖训练集说话人相对应的手机和平板远场数据。另外，本届挑战赛的一个新任务是跨语言的自监督/半监督学习，参赛者可以使用 FFSVC 2020 的训练/开发/补充数据集（中文，域内，无标签）和 VoxCeleb 1&2 数据集（英文为主，域外，有标签）来构建模型。

03 任务描述

今年 FFSVC 2022 重点关注远场单通道场景。这次比赛有两项说话人识别任务：

Task1. Fully supervised far-field speaker verification

(全监督的远场说话人验证)
Task2. Semi-supervised far-field speaker verification

(半监督远场说话人验证)

任务1和任务2都是固定训练集任务，即参赛者只能使用指定的训练集来构建说话人验证系统。固定训练集由以下三个数据库组成：

VoxCeleb 1&2
FFSVC2020 train and dev set
FFSVC2022 supplementary set (新发布)

在任务1中，参赛者可以使用 VoxCeleb1&2 和 FFSVC 2020 数据集的说话人标签来构建说话人识别模型；对于任务2，参赛者可以使用 VoxCeleb1&2 的说话人标签，但不能使用 FFSVC 2020 数据集（train/dev/supplement）的说话人标签。在任务2中，我们鼓励参赛者采用自监督或半监督的方法对域内数据进行标注或生成伪标签的方法进行训练。

注：禁止使用其他语音数据集对系统进行训练，但允许参赛者使用开源的非语音数据集（如MUSAN，RIR_NOISE）进行数据扩充。自监督的预训练模型（如Wav2Vec, HuBERT, WavLM）不能用于此次比赛。

04 数据集介绍

VoxCeleb 1&2

请访问：

https://www.robots.ox.ac.uk/~vgg/data/voxceleb/

获取更多关于VoxCeleb数据的信息

FFSVC 2020 数据集

训练集和开发集

FFSVC 2020 的训练集和测试集由近讲高保真麦克风、近讲手机和远场麦克风阵列数据组成。所有人录制语音三次（命名为F，S，T），每次间隔7-15天。

如果你没有这部分的数据，可向下方邮箱以 “Apply for the FFSVC2020 Challenge data” 为主题申请数据。

申请邮箱：

aishell.foundation@gmail.com

数据详情地址：

http://www.aishelltech.com/FFSVC_2020

补充集

FFSVC 2020 的补充集是 FFSVC 2020 训练集的补充集，所有说话人信息和 FFSVC 2020 的训练集对应，该数据是由远场手机和远场平板数据组成，可在 FFSVC 2022 比赛官网下载。

FFSVC 2022 开发集和测试集

FFSVC 2022 的开发集将为参赛者提供一个包含准确说话人信息的trial文件和对应的音频文件。FFSVC 2022 开发集与测试集具有相同的数据分布。然而，FFSVC 2022 的开发集仅允许用于调整超参数和测试模型性能，不允许在训练中使用

05 时间安排

06 注册与提交

由于今年比赛的 leaderboard 和提交在 Codalab 平台上，因此比赛的注册也将放到 Codalab 平台上。我们恳请您将您的 Codalab 帐户使用您所在机构/学校/公司的电子邮件注册。

以下是对应任务的 codalab 链接：

Task 1. Fully supervised far-field speaker verification. （https://codalab.lisn.upsaclay.fr/competitions/2167）
Task 2. Semi-supervised far-field speaker verification. （https://codalab.lisn.upsaclay.fr/competitions/2166）

提交

参赛者必须为每个参与任务向 Codalab 平台提交至少一份有效的分数文件。在 Codalab 中，点击“Participants”选项卡下的“Submit/View Results”链接可以提交你的分数文件。您必须以 ZIP 文件的形式提交结果，其中只包含一个名为“scores.txt”的文件。文件必须位于 ZIP 文件的根目录下，并且 ZIP 文件不应包含任何文件夹。评分文件应为 UTF-8 格式，每次试验一行。请访问官网下载样例文件。