AI手机-手机SIM卡通话内容ASR识别和文字提取-(二、商用ASR方案)

AI手机-手机SIM卡通话内容

ASR识别和文字提取-(二、商用ASR方案)

商用的ASR方案

目前在语音领域涉及收费的方案主要集中在智能硬件领域的AI交互、实时翻译、智能会议配件,以及软件增值领域的智能客服、会议纪要、内容识别、语音质检等方面。在toB和toC市场的总体表现一般是toC软件的部分免费、toC的硬件收硬件费用、toB的软件收接口费和时长费。

目前国内应用较为广泛的ASR方案大致有阿里、讯飞、百度、腾讯等方案商提供的支持,它们都采用公有服务器识别的方案,使用时需将自己本地的语音数据上传到其提供的接口,并等待识别内容的结果返回。

目前ASR领域在准确率、识别效率、并发数、实时/非实时等特征上差异不大,当前差异最主要在以下几个方面:

  1. 多种本地化语言的支持,如粤语、四川话、闽南语等特定语系的支持
  2. 对多人通话场景的识别,如根据一段录制的语音,排除干扰背景后,能识别出有n个人的声音,他们分别说了哪几句话
  3. 对长语音、短语音的支持力度,响应速度(比如同声互译等极限场景)。
  4. 输出的ASR芯片或模块的价格和整合的难易程度。

本次预研仅针对【实时语音转写】的能力进行分析,根据搜集和初期预研的结果,上述ASR商用方案的特点和差异如下:

阿里云商用ASR

阿里云ASR平台是国内较为知名的ASR平台之一。它提供了多种语言的语音识别服务,并且具有较高的准确率。阿里ASR平台的价格根据服务量和使用时间而定,一般在0.04元/分钟左右。

阿里云的长时间实时语音数据流进行识别,适用于会议演讲、视频直播等长时间不间断识别的场景。支持PCM、OPU音频编码格式,支持Java,C++,iOS,Android;流程为先推送申请指令,然后实时传递语音流,然后发送结束指令。

阿里云语音识别价格有免费和付费版本,免费版本最大并发为2,商务专用版 最大为200/100两个并发,也可以按量付费。参考阿里语音识别报价

阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台

讯飞商用ASR

实时语音转写(Real-time ASR)基于深度全序列卷积神经网络框架,通过 WebSocket 协议,建立应用与语言转写核心引擎的长连接,将音频流数据实时转换成文字流数据结果

WebSocket形式输入PCM实时音频流,导出json格式数据

价格为2万元/路/年,新用户免费限时使用。

文档地址:讯飞开放平台文档中心

​​​​​​​百度商用ASR

百度ASR平台是国内最为知名的ASR平台之一。它提供了多种语言的语音识别服务,并且具有较高的准确率。百度ASR平台的价格根据服务量和使用时间而定,一般在0.02元/分钟左右。

百度语音目前每个账号可享10小时免费调用,超出免费时长后,可以购买预付小时包,也可按调用时长后付费。

百度短语音识别采用最新解码技术,API接口识别速度提升5倍以上,耗时仅音频时长十分之一,提升语音交互体验。

百度ASR的文档地址:语音技术-百度智能云

​​​​​​​腾讯云商用ASR

腾讯云ASR平台是另一家知名的ASR平台。它提供了多种语言的语音识别服务,并且具有较高的准确率。腾讯ASR平台的价格根据服务量和使用时间而定,一般在0.03元/分钟左右。

目前腾讯的“一句话语音识别”是试用免费的,识别60s内的短语音,当音频放在请求body中传输时整个请求大小不能超过1M,当音频以url方式传输时,音频时长不可超过60s。接口请求频率限制:20次/每秒。

腾讯ASR的文档地址:语音识别 实时语音识别(websocket)-API 文档-文档中心-腾讯云

小结

商用ASR方案主要是同时支持多语言、高并发、高响应速度上面比较有优势,但一看价格和合作方式,汗,玩不了。

我们最初选型的时候,只是想在提取到实时语音的基础上做一些增值业务,这种按流量按分钟数收接口并发费用的,不符合我们的初期的业务探索活动。

往后尽量往开源的免费ASR方案进行选型和靠拢。


上一篇:AI手机-手机SIM卡实时通话内容ASR识别和文字提取-(AI手机通话功能探索)

下一篇:没有了

  • 14
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 3
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值