由海天瑞声支持，全球最大多领域英语开源数据集发布

最新推荐文章于 2024-08-30 08:02:33 发布

Elevendayday

最新推荐文章于 2024-08-30 08:02:33 发布

阅读量168

点赞数

文章标签：语音识别人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Elevendayday/article/details/130726451

版权

GigaSpeech是由多个团队和语音社区联合发布的，包含10000小时标注音频的多领域英语开源数据集，旨在推动语音识别技术的学术与产业界进步。数据集覆盖有声读物、播客和YouTube，提供不同规模的子集以适应各种训练任务，并设有排行榜展示不同ASR框架的性能。

摘要由CSDN通过智能技术生成

日前，由陈果果、都家宇、张卫强等发起的语音社区志愿者组织SpeechColab和清华语音与音频技术实验室，联合语音社区的8个团队，在语音界大神Daniel Povey, Sanjeev Khudanpur, Shinji Watanabe等的大力支持下（详见下图），发布了全球最大的多领域英语开源数据集—GigaSpeech,介绍该数据集的论文已被国际语音顶会InterSpeech2021接收。

在这里插入图片描述

GigaSpeech参与人员及团队，完整论文下载见下文

海天瑞声很荣幸参与了本次开源数据集的工作，为部分数据集提供了标注以及全部数据集的镜像下载支持，也为全球语音识别技术的探索贡献了自己的力量。

语音识别的性能，很大程度上取决于训练数据集的规模和覆盖性。现有的语音开源数据集适用领域狭窄，缺少难度挑战，准确率接近饱和。学术界和工业界研究开始分道扬镳，碎片化严重。作为目前全球最大的多领域英语开源数据集，GigaSpeech致力于推动学术界和产业界的共同进步。

01

概述

GigaSpeech是一个不断发展的、多领域英语语音识别语料库。它拥有10000小时的高质量标注音频，适用于有监督训练任务；以及33000小时的总音频，适用于半监督和无监督训练任务。

02

数据来源及质量控制

从发音风格和覆盖主题入手，GigaSpeech从有声读物、播客和YouTube上收集了约33000小时的转录音频，以及对应的人工转录文本、人工字幕等，涵盖诵读和自发

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Elevendayday CSDN认证博客专家 CSDN认证企业博客

码龄6年

23: 原创

137万+: 周排名

199万+: 总排名

4986: 访问

: 等级

255: 积分

2: 粉丝

1: 获赞

9: 评论

4: 收藏

私信

关注

热门文章

分类专栏

大数据 1篇
AI 1篇

最新评论

企业如何赢取“AI数字人”先机？
CSDN-Ada助手: 恭喜您撰写了第15篇博客，标题为“企业如何赢取‘AI数字人’先机？”这是一个极具吸引力的话题，我欣喜地看到您对AI在企业中的应用进行了深入探讨。在这篇博客中，您提出了一个非常重要的问题，并给出了一些有见地的观点。您的文章透露出您对AI技术的深入了解和对企业发展的敏锐洞察力。您清晰地讲述了企业如何利用AI数字人来赢得先机，并提供了宝贵的建议。作为下一步的创作建议，我希望您能进一步探索AI数字人的实际案例和成功故事，这将为读者提供更多的启示和实践指南。同时，也可以考虑分享一些与AI数字人相关的挑战和解决方案，以帮助企业克服可能的困难。再次祝贺您取得的博客创作进展，期待您未来更多精彩的文章！
海天瑞声助力自动驾驶技术升级，推动产业创新发展
CSDN-Ada助手: 恭喜作者撰写了第18篇博客！标题所提到的海天瑞声助力自动驾驶技术升级，推动产业创新发展的主题非常吸引人。通过这篇博客，我们了解到了海天瑞声在自动驾驶领域的贡献，以及对产业创新发展的推动作用。在未来的创作中，我期待作者能够继续深入探讨自动驾驶技术的前景和挑战，或者分享一些海天瑞声在其他领域的创新案例。谦虚之余，我相信作者的博客将为读者带来更多启发和思考。加油！
AI如何推动工业制造向“智造”升级？
CSDN-Ada助手: 恭喜您撰写了第19篇博客！标题“AI如何推动工业制造向‘智造’升级？”引人入胜，内容也相当精彩。您对工业制造与AI融合的探讨令人深思，展示了您对这一领域的深刻见解。我非常期待您未来的创作，希望您能继续分享关于工业智造领域的新观点和案例，或者深入探讨如何优化智能算法在工业制造中的应用等方面。希望您在下一篇博客中继续保持谦虚的态度，以便我们能够从您的独特视角中汲取更多有关智能制造的知识。再次恭喜您的持续创作！
海天瑞声开源多模态数据集，解决多模态模型准确性问题
CSDN-Ada助手: 恭喜用户写下了这样一篇关于海天瑞声开源多模态数据集的博客，非常有见地。您的文章提到了非常重要的问题，也给出了很好的解决方案。接下来，我建议您继续深入探讨多模态模型在不同场景下的应用，并分享您的实践经验和新的发现。期待您的更多精彩文章！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
海天瑞声|从数据看AI赋能下的智慧金融场景
CSDN-Ada助手: 恭喜用户撰写了这样一篇有趣的博客，深入探讨了AI在金融领域中的应用。我们期待着更多这样的深入探讨，特别是关于AI在其他领域的应用。希望您能继续保持这样的创作热情，为我们带来更多有价值的文章。 CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。