java 语音识别_宏颜获水:领略一下百度AI技术中的语音识别吧

前几日闹的沸沸扬扬的宏颜获水,让百度的AI技术再次被公众所认知,这里的认知不是对AI技术的认知,而是对百度追求AI技术的认知。今天就来说一说百度人工智能领域的语音识别技术。

71278f63925d70d57d995d2335577690.png

首先你要在百度AI的开发者平台注册你的账号,可以获取里面免费调用的资源,登陆之后如下:

2b3713848445cc1eb28eb0f53e3976c3.png

然后创建新应用用来生成调用相关接口的一些APPID和APPSECRET等,如下:

401defd382c027619af0ef59b3418ba2.png
c44d35fb16dd1d0d5f117ef26624b1e5.png

这里面有Java、Python、PHP等相关的说明和SDK:

a5b638d05e1d795714dc2c4bbeaa7966.png

创建完应用就可以得到下面的调用信息:

fcc60963a26d126afa128e6a44b4073e.png

下面以Python调用为例,来演示语音识别:

首先按照模块baidu-aip,相当于Java中的jar包:

50b046a3c8e19fdf5e21dcdf942c6c3d.png

写个小demo来实现一下,代码如下:

939cfcebcc3f6a192e24305cc04d9d97.png

其中speech.asr(data, 'wav', 16000, {'dev_pid': 1536, })是进行语音识别的,data是音频的二进制数据;'wav'是音频的格式;16000是音频的采样率,也就是16k的音频; {'dev_pid': 1536, }是方言类型或者普通话,参数如下:

e911b2cffc4a3cb4966bcde5c4d221a8.png

这在百度开发者平台上的文档都有说明,hc.wav中是录的一段音频,里面到底说的什么,我们运行一下代码,给它识别出来:

563e94cc18a67ae330b345646516ca36.png

哈哈,完全正确,就是这句发嗲的普通话!成功返回的格式就是如下:

{ "err_no": 0, "err_msg": "success.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值