语音之家SOTA|开源发布: SPEECHIO_ASR_ZH00004 罗振宇跨年演讲

本期开源发布为 [罗振宇跨年演讲] 场景,测试集ID:

SPEECHIO_ASR_ZH00004

获取方式:

平台:Linux / MacOS

Step 1 获取 leaderboard 代码仓库:

初次获取:

git clone https://github.com/SpeechColab/Leaderboard

日后更新:

cd Leaderboard

git pull

Step 2 下载测试集:

ops/pull dataset 测试集ID

* 请确保本地与repo最新代码同步,遵循"Live at HEAD"原则,项目不维护历史版本。

* 若日后上述下载过程有变更,请阅读 repo 中 README.md,以该介绍为准。


数据说明:

音频:16k16bit mono wav

标注: 为方便使用,测试集的发布准备了两套 label 格式:

  • 格式1 metadata.tsv:包括音频路径,音频长度,文本标注等字段

  • 格式2 Kaldi : wav.scp & trans.txt

数据集可直接在 leaderboard 中使用,方便SpeechIO 的读者以及厂商复现、核对评测结果。有问题可以后台留言也可以直接提交 Github Pull Request

费用及打赏:

  • 分发采用了商用的阿里云对象存储服务,大量的数据分发会对 SpeechIO 产生高额流量费用。原则上希望每一个因为我们开源受益的下载者都可以打赏本系列“开源发布”文章。

  • 建议后来的读者可以多翻阅公众号历史文章,获取以往开源信息,对于过去发布过的信息,后台提问不做回复。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值