更低价的Python语音识别【含离线】

本文章仅仅讲述了思路,具体代码可以百度搜索。

为什么要低价?

想去开发一款商用的语音识别,比如智能家具之类的,因此会遇到大量的访问(如果遭受黑客攻击,你所购买的语音包可能会在几分钟之内被调用完)。

并且在线的语音识别价格并不客观,百度云每个要0.0011元/次,华为云更是贵的离谱。

而例如讯飞这样的离线识别语音包,却不支持windows平台,因此我们需要一个更便宜的离线识别方案

离线识别很差劲吗?

如果让我评价离线识别,只能说在python平台上,不好做。

目前python最大的离线识别就是sphinx,实际体验效果不好,但是可以进行小范围的输入,比如开启 空调,这样的指令,做智能对话,就变得完全无用。

当然啦,也不是一无是处,目前这个库的功能就是用来做唤醒功能的,可以自定义词库,去训练它。

谷歌识别 最好的方案

谷歌语音识别,真的是目前最好的方案,但是大陆无法访问,当然,你可以去考虑购置一台香港的服务器,然后搭建一个转发功能,把用户上传的语音文件传给谷歌,然后返回给用户识别出来的文字。

然而这绝对不是长久之计,因为人口基数庞大的话,你的带宽可能撑不住。

kaldi真正的智能识别

这是我正在尝试的方案,因为利用java,C++去开发语音识别的比较多,比如kaldi,可以利用一些别人发布的模型去使用。

缺点就是,离线识别的库太大了,如果说你不在意那几百m的空间,可以塞进客户端。

文章很短,只是记录下我的思路,前两者我都去尝试过了,实在是不可行。如果哪家大公司愿意出一个桌面级的离线识别接口,那就是大吉大利了(虽然这不可能,因为这会牵扯到他们的利益)

©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页