语音之家SOTA | 开源发布:SPEECHIO_ASR_ZH00002 鲁豫有约

目前已解锁场景

  • SPEECHIO_ASR_ZH00000 :Leaderboard 调试集(经济、货币、金融)

  • SPEECHIO_ASR_ZH00001 场景:新闻联播

  • SPEECHIO_ASR_ZH00002 场景:鲁豫有约

获取方式:

支持平台:Linux / MacOS

'''

Step 1 克隆 leaderboard 代码仓库:

git clone https://github.com/SpeechColab/Leaderboard

cd Leaderboard

Step 2 下载测试集:

ops/pull dataset SPEECHIO_ASR_ZH00002

'''

若日后上述下载过程有变更,则以 repo 中 README.md 说明为准。

数据说明:

  • 格式:

    • audio:16k16bit mono wav

    • label: 为方便使用,测试集的发布准备了两套 label 格式:

      • 格式1 metadata.tsv:包括音频路径,音频长度,文本标注等字段

      • 格式2 Kaldi : wav.scp & trans.txt

  • 数据集可直接在 leaderboard 中使用,方便SpeechIO 的读者以及厂商复现、核对评测结果,欢迎合理的修改建议和 Pull Request。

费用:

分发采用了商用的阿里云对象存储服务,大量的数据分发会对 SpeechIO 产生高额流量费用。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值