语速对科大讯飞,百度,思必驰,云知声的语音引擎识别结果影响对比

大家好,时间过得真快,转眼进入到四月份了,语音测评君又给大家带来了新一期语音相关的测评报告。结合现在语音算法公司越来越多的情况,本次小君针对当前市场份额较大的几家算法公司,分别测试了语速对语音引擎识别结果的影响。这几家公司分别是科大讯飞,百度,思必驰信息科技和云知声信息科技有限公司。每个公司都有自己的开发平台,给广大语音开发爱好者提供的开源的开发接口,给大家提供了相关的SDK和开发文档。
本次测评主要是对比每家语音识别引擎对快中慢语速的处理,测试语音信息详情如下:
 音频编码格式:wav
 音频采样率:16000Hz
 文本字数:每条平均60字左右,共计615字。
 音频分类:分为快语速、普通语速、慢语速,共计30条音频,每类10条
 音频领域:歌曲、闲聊
正常情况下,不同人说话的语速是不一样的,有人说话快,有人说话慢。所以小君这次测试的出发点是站在人正常说话的角度考虑的,并没有仅仅是为了测试算法而去设置极限值。

展示一下文本样例:

  1. 这是一首唱给母亲听的歌曲,他曾经在综艺节目笑着谈起母亲逝世前的点滴,十分感人。毛不易的另外一首歌曲《消愁》的词沉浸着对生活的深切感悟,可以扎人心。
  2. 现在中国的男人比女人多那么多,可以说一定是有几千万是娶不到媳妇的。这绝对不是危言耸听,这就是事实,而且很可能有些男同胞已经感觉出来了。

语音文本的信息相信大家了解的差不多了,那让我们来看一下对比结果,来分析各引擎的优缺点吧。
(备注:以上测评结果仅基于本次验证集)

结果分析:基于本次验证集的数据对比分析,百度和科大讯飞的语音识别引擎在慢语速识别率较其他两个厂家存在一定的差距,百度慢语速语音识别率为46.50%,科大讯飞为75.11%,而另外两家的慢语速识别率分别达到了98.70%和95.45%。四家算法厂商在普通语速和快语速方面的识别率还是相当高的。
由于小君仅仅测试了音乐和闲聊两个领域,可能这两个领域并不是百度和讯飞的专长,如果想看更多领域的测评结果,您可以联系语音测评君,小君欢迎您随时关注和联系!

  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值