python调用api应用接口_Python调用百度API实现语音识别(一)

66120ff018455311da942aa690a0586c.png

Python调用百度API实现语音识别(一)

前言

上篇文章介绍了下如何用 Python 剪辑视频,想回顾的同学可以拉到文章最下面,有历史链接。

有了上篇文章野狼disco的音频,今天就来带大家玩一下百度的API,如何借用百度 API 的语音识别功能,将我们的音频转为文字。最终落地到 word 中。

当然,转为文字后,也为之前语音机器人做了铺垫,转换的文字可以写入到程序中,后续机器人朗读声音而用。

百度 API 官网准备工作

  1. 搜索

d262436533a4af23b69910774d6adb1b.png
  1. 开放能力 -> 语音技术 -> 语音识别

f5324f7f719a25244dc0f0318a6ee4e5.png

可以看到这里有三种语音类型,点哪个都行,这里选择语音识别即可。

e98d444d40019055a20eff79aca836c8.png

先点击技术文档看下:

a7cc4f6c18ce66a5a71d026653cd2f05.png

左侧实际上只包含了标准版和极速版,没有看到长语音版。

对比了下价格,果断选择了标准版!自己玩,怎么实惠怎么来!

361498938d5b6fe5ad3f5645fd6f5605.png

看了上面普通版的文档,有几点需要注意的:

  1. 格式
原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道,支持的格式有:pcm(不压缩)、wav(不压缩,pcm编码)、amr(压缩格式)。
百度开放平台
  1. 时长
目前系统支持的语音时长上限为60s,请不要超过这个长度,否则会返回错误。
百度开放平台

注册获取key

不论是之前写过的调用高德api,还是这次的百度api,都可以找到共性,你在用别人提供的接口时,必须要有身份验证这一步。

这意味着你需要去人家平台注册,获取到人家平台给你颁发的身份验证。也就是 key 之类的信息。

查看 Python SDK 文档发现:

7d82701d0e3cd797f23a247464623bc8.png

文档页的右上侧,有个控制台,点进去,自己注册下。

  1. 左侧音频图标 -> 创建应用

62278e6c80fe5daef2ff59553f88055b.png
  1. 填写信息

f98f492172d0f76db99e327ad3ffc4bf.png
  1. 完成

d2696ade5ca93b3dec4d773c0a4f9529.png

14b087451339a5c316380fd14d324a7e.png

总结

前戏已备好,key等信息已经有了。只需要记住上面说的两个注意点即可。

下一篇开始我们真正的编码。

有什么问题,欢迎评论区留言!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值