python调用api应用接口_Python调用百度API实现语音识别（一）

最新推荐文章于 2024-04-04 20:05:25 发布

weixin_39853892

最新推荐文章于 2024-04-04 20:05:25 发布

阅读量196

点赞数

文章标签： python调用api应用接口 python调用api接口获取数据

Python调用百度API实现语音识别（一）

前言

上篇文章介绍了下如何用 Python 剪辑视频，想回顾的同学可以拉到文章最下面，有历史链接。

有了上篇文章野狼disco的音频，今天就来带大家玩一下百度的API，如何借用百度 API 的语音识别功能，将我们的音频转为文字。最终落地到 word 中。

当然，转为文字后，也为之前语音机器人做了铺垫，转换的文字可以写入到程序中，后续机器人朗读声音而用。

百度 API 官网准备工作

搜索

开放能力 -> 语音技术 -> 语音识别

可以看到这里有三种语音类型，点哪个都行，这里选择语音识别即可。

先点击技术文档看下：

左侧实际上只包含了标准版和极速版，没有看到长语音版。

对比了下价格，果断选择了标准版！自己玩，怎么实惠怎么来！

看了上面普通版的文档，有几点需要注意的：

格式

原始 PCM 的录音参数必须符合 16k 采样率、16bit 位深、单声道，支持的格式有：pcm（不压缩）、wav（不压缩，pcm编码）、amr（压缩格式）。
百度开放平台

时长

目前系统支持的语音时长上限为60s，请不要超过这个长度，否则会返回错误。
百度开放平台

注册获取key

不论是之前写过的调用高德api，还是这次的百度api，都可以找到共性，你在用别人提供的接口时，必须要有身份验证这一步。

这意味着你需要去人家平台注册，获取到人家平台给你颁发的身份验证。也就是 key 之类的信息。

查看 Python SDK 文档发现：

文档页的右上侧，有个控制台，点进去，自己注册下。

左侧音频图标 -> 创建应用

填写信息

完成

总结

前戏已备好，key等信息已经有了。只需要记住上面说的两个注意点即可。

下一篇开始我们真正的编码。

有什么问题，欢迎评论区留言！

weixin_39853892

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。