本期开源发布为 [天下足球] 场景,测试集ID:
SPEECHIO_ASR_ZH00003
获取方式:
平台:Linux / MacOS
Step 1 获取 leaderboard 代码仓库:
初次获取:
git clone https://github.com/SpeechColab/Leaderboard
日后更新:
cd Leaderboard
git pull
Step 2 下载测试集:
ops/pull dataset 测试集ID
* 请确保本地与repo最新代码同步,遵循"Live at HEAD"原则,项目不维护历史版本。
* 若日后上述下载过程有变更,请阅读 repo 中 README.md,以该介绍为准。
数据说明:
音频:16k16bit mono wav
标注: 为方便使用,测试集的发布准备了两套 label 格式:
-
格式1 metadata.tsv:包括音频路径,音频长度,文本标注等字段
-
格式2 Kaldi : wav.scp & trans.txt
数据集可直接在 leaderboard 中使用,方便SpeechIO 的读者以及厂商复现、核对评测结果。有问题可以后台留言也可以直接提交 Github Pull Request
费用及打赏:
-
分发采用了商用的阿里云对象存储服务,大量的数据分发会对 SpeechIO 产生高额流量费用。原则上希望每一个因为我们开源受益的下载者都可以打赏本系列“开源发布”文章。
-
项目是长期运行,若目前的打赏方式无法覆盖 SpeechIO 开源的最基本开销,我们后续再考虑公众号发文调整。
-
建议后来的读者可以多翻阅公众号历史文章,获取以往开源信息,对于过去发布过的信息,后台提问不做回复。