BAT(百度、阿里、腾讯)语音合成、语音播报方案调研

1、背景

公司目前有个业务使用的百度语音播报要收费了,且收费不便宜;
目前统计了线上在用的百度语音日均调用 2200+次,一年请求约 80.3W 次(后面会用到这个统计数据);

2、需求

  寻找替代方案,降低成本;

3、名词解释

  语音识别 (Automatic Speech Recognition,ASR) 将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者文本字符序列;
  语音合成(Text To Speech,TTS)将文本转化成拟人化语音,打通人机交互闭环。可以支撑多场景、多语言的音色,支持自定义音量、语速等参数。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景;
  语音播报 即语音合成;

4、方案调研

4.1、方案简介

方案一:百度语音合成:
  1、支持多种收费标准:按次数包预付费、按调用量后付费、并发量扩容;
  2、支持按字节、调用次数收费,支持阶梯收费; 支持http请求、java SDK调用

方案二:阿里云语音合成:
  1、这次预付费和后付费两种方式;
  2、按调用次数收费,支持阶梯收费; 支持http请求、java SDK调用

方案三:腾讯语音合成:
  1、这次预付费和后付费两种方式;
  2、按字节收费; 支持http请求、java SDK调用

方案四:科大讯飞语音合成 :
  1、按调用次数收费,按年收费; 支持http请求、java SDK调用

方案五:下载语音文件,自定义识别 免费 下载的语音文件固定,扩展性不高、后期需求变更时维护成本高

4.2、价格说明

服务商收费标准
百度在这里插入图片描述在这里插入图片描述
阿里云在这里插入图片描述
腾讯在这里插入图片描述在这里插入图片描述
科大讯飞在这里插入图片描述

4.3、价格对比

4.3.1、按月调用次数预估价格在这里插入图片描述

4.3.2、年预估总价在这里插入图片描述

4.3.3、方案总结

服务商结论
百度年调用次数在1000W次以内比较划算
阿里年调用次数大于1000W次比较划算
腾讯按照字符收费,短文本使用比较划算(很符合我们的场景);新人注册800万免费字符,三个月内有效;
科大讯飞按年收费,价格比较固定

4.3.4、并发限制

参考:目前百度语音日均请求 2200+ 次;

服务商并发规则
百度默认支持100并发,超过的部分支持付费升级:100元/路/月 或 1000元/路/年;
阿里云默认支持200并发,超过200路并发的部分支持付费升级:100元/路/月;
腾讯QPS限制 20次/秒;

接口效率测试(都是生成 mp3 格式文件的数据):
单线程,测试125家物流公司和0-500数字全部处理完毕(626次请求)耗时(单位:毫秒)

服务商第一次第二次
百度125821123720
阿里云184559191831
腾讯云195568190335





最后,大家根据自己的业务场景选择合适的方案吧。


PS:以上收费规则统计于 2022年05月 ,服务商随时可能会修改计费规则,本文仅供参考~

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值