![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
SpeechIO
文章平均质量分 61
语音之家
这个作者很懒,什么都没留下…
展开
-
语音之家SOTA|开源发布: SPEECHIO_ASR_ZH00004 罗振宇跨年演讲
本期开源发布为 [罗振宇跨年演讲] 场景,测试集ID:SPEECHIO_ASR_ZH00004原创 2023-02-08 11:35:16 · 125 阅读 · 0 评论 -
语音之家SOTA|开源发布:SPEECHIO_ASR_ZH00003 天下足球
本期开源发布为 [天下足球] 场景,测试集ID:SPEECHIO_ASR_ZH00003原创 2023-02-08 11:29:25 · 252 阅读 · 0 评论 -
语音之家SOTA|Leaderboard 新增 WenetSpeech 数据集预训练 WeNet 模型
仔细对比上述评测数字差异,公众号的读者朋友们可以切实感受一下数据对于模型性能的重要性。现阶段AI行业的实际落地,刻意回避数据,只强调技术优越性的人,短视与欺骗必占其一。从数字可以看出,基于 WenetSpeech 数据集的 WeNet 模型在性能上已经超过了百度的付费商业引擎,逼近行业头部商业引擎的 [从数据到框架的全栈开源系统,在性能上开始超越商业付费系统的案例,在很多技术领域的发展历史中都可以找到,对本行业的意义自不必多说。祝贺 WeNet 团队。原创 2022-11-04 15:52:31 · 607 阅读 · 0 评论 -
语音之家SOTA | 开源发布:SPEECHIO_ASR_ZH00002 鲁豫有约
数据集可直接在 leaderboard 中使用,方便SpeechIO 的读者以及厂商复现、核对评测结果,欢迎合理的修改建议和 Pull Request。SPEECHIO_ASR_ZH00000 :Leaderboard 调试集(经济、货币、金融)分发采用了商用的阿里云对象存储服务,大量的数据分发会对 SpeechIO 产生高额流量费用。格式1 metadata.tsv:包括音频路径,音频长度,文本标注等字段。SPEECHIO_ASR_ZH00001 场景:新闻联播。支持平台:Linux / MacOS。原创 2022-09-22 15:33:53 · 378 阅读 · 0 评论 -
语音之家SOTA | TIOBE 滚动测试报 2021.10
发现 [直播带货 李佳琪薇娅] [直播王者荣耀 张大仙骚白] [老罗语录] 三个场景测试集标注错误,全面检查&修正;,为阿里云新算法的试用版;测试集发布:[新闻联播] 测试集已公开发布,后续滚动测试不会每期都覆盖该场景。测试:全厂商 × 全场景 滚动刷新测试。测试:全厂商 × 全场景 滚动刷新测试。测试:全厂商 × 全场景 滚动刷新测试。测试:全厂商 × 全场景 滚动刷新测试。测试:全厂商 × 全场景 滚动刷新测试。测试:全厂商 × 全场景 滚动刷新测试。测试:全厂商 × 全场景 滚动刷新测试。原创 2022-09-21 16:30:52 · 331 阅读 · 0 评论 -
语音之家SOTA | 同声传译现场 时政
本类素材,源语言说话人的音量一般会被压制得非常低,可听见,但听不清内容,从语音识别的角度来讲更像是一种噪声。这种人声噪声,对频谱造成的干扰比一般噪声要复杂得多,对语音系统的挑战也更大。内容上,本期测试内容很简单,主要是一些时政新闻中的常见词汇和话题。本场景为英文到中文的同传现场,场景目标是识别中文内容,由标注员负责切分并标注中文同传声音的片段。讯飞和阿里的引擎对低音量灵敏且对英文比较灵敏,经常识别出零散的英文乱码词汇,错误率较高。同传室,制作棚,同传人员周边安静,无噪声。组织语言常见卡顿,重复。原创 2022-09-19 16:19:15 · 312 阅读 · 0 评论 -
语音之家SOTA|TIOBE 场景测试:华语大学生辩论赛
讯飞目前被低估(听写服务场景匹配差),转写服务接入调试中,详见(SOTA)YouTube 爬取,华语大学生辩论世界杯,现场视频,原始时长约2小时。现代的商业语音识别引擎面对快语速场景时的表现,相比传统技术更加稳定鲁棒。本场景会进行定期重测(每3个月),关注最新滚动测试报告查看最新结果。辩题为:大学生兴趣爱好、专业能力培养、道路选择。大学生辩论赛队员,主持人,致辞嘉宾等。辩论赛吐字清晰,半备稿,语言较流畅。辩论赛现场,室内场馆会场,有观众。场景测试:华语大学生辩论赛。场景:华语大学生辩论赛。原创 2022-09-16 18:43:04 · 284 阅读 · 0 评论 -
语音之家SOTA | TIOBE 场景测试:电台节目 张震鬼故事
YouTube 抓取“张震鬼故事” 往期节目,原始音频约3小时。原创 2022-09-14 13:54:12 · 216 阅读 · 0 评论