【Wiki】VoxCeleb数据库audio部分注解

简介

官方介绍及下载地址

分为VoxCeleb1 和 VoxCeleb2两个部分。

每个数据库有三个部分:
1)URLs和时间戳:包含每个youtube video的URLs和时间戳。
下载后得到一个后缀为 _txt.zip的文件,解压后,所有信息以文件夹形式呈现,文件夹名称为speaker id,示例如下:
在这里插入图片描述
点击进入后,得到speaker id所对应的URL信息,示例如下:
在这里插入图片描述
这些文件夹名为URLs的最后几位,用 https://www.youtube.com/watch?v= 补全后,能够链接到该speaker id 所指代的人的YouTube video。示例如下:https://www.youtube.com/watch?v=_raOc3-IRsw
在这里插入图片描述
点击文件夹进入后,得到 frame X Y W H等信息,这些信息对语音相关的算法而言,可略过。
2)Audio files:音频
3)Metadata:speakers的id、国籍、性别标签等信息。voxCeleb1中还包含speaker的全名,可以通过wikidb直接获取speaker的出生日期,但voxCeleb2没有该信息,需要通过YouTube url获取说话人的全名。

无账号下载

使用迅雷,通过添加链接的方式下载。【新建】>>【添加链接或口令】。附图如下:
在这里插入图片描述

Voxceleb Enrichment(增添age info)

原文

https://arxiv.org/pdf/2109.13510.pdf
原数据库不包含说话人的年龄信息,该文提出了获取speaker年龄和性别的可靠方法。其流程如下:
在这里插入图片描述

Code in JupyterNotebook

详细实现可参照如下链接:https://github.com/hechmik/voxceleb_enrichment_age_gender

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值