百度AI开放平台学习——在线语音合成
概览
今天更新一个简单的语言在线合成的教程。个人比较喜欢看官方写的文档。
百度的在线语音合成文档地址:
https://ai.baidu.com/ai-doc/SPEECH/Gk4nlz8tc
快速入门就这几句:
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis('你好百度', 'zh', 1, {
'vol': 5,
})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
with open('auido.mp3', 'wb') as f:
f.write(result)
总体上很简洁。十分容易弄懂接口的流程。
接下来进行真机测试
真机配置
- ubuntu 20.04
- 系统自带python3.8
- PyCharm2020
- virtualenv与virtualenvwrapper,虚拟环境的安装可以参考之前写过的文章ubuntu下virtualenv与virtualenvwrapper的安装与配置
官方密钥获取
这种接口形式的产品都是需要使用密钥进行验证的。目的就是为了保证客户和提供商的安全。
首先登陆百度智能云:
https://cloud.baidu.com/?from=console
点击产品——>人工智能——>语言合成——>立即使用
现在就进入了管理控制台,我们需要创建应用
填写应用类型,应用名,描述等
点击创建
创建成功后我们就得到了我们需要的
AppID
,API Key
,Secret Key
真机环境配置
接下来我们打开Pycharm新建一个python项目,在创建选项中我们新建一个虚拟环境baiduai
点击create
,项目就新建好了。
我们新建一个python文件名为baiduai.py
接下来我们打开官方文档
https://ai.baidu.com/ai-doc/SPEECH/Gk4nlz8tc
点击文档左侧的语音合成——>在线语音合成——>在线合成Python-SDK——>快速入门
按照文档要求我们安装baidu-aip
在Pycharm下方找到terminal
并点击
在下面的终端输入:
pip3 install baidu-aip
这样SDK就安装完毕
真机测试
按照官方文档,在baiduai.py
输入:
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
result = client.synthesis('你好百度', 'zh', 1, {
'vol': 5,
})
# 识别正确返回语音二进制 错误则返回dict 参照下面错误码
if not isinstance(result, dict):
with open('auido.mp3', 'wb') as f:
f.write(result)
用自己的App ID
,Api Key
,Secret Key
替换掉代码里的你的 App ID
,你的 Api Key
,你的 Secret Key
接下来点击pycharm右上的Add Configuartion
,点击+
找到python并点击
在右侧的Script Path
中找到并选择baiduai.py
点击OK
接下来会在右上方看到一个绿色的三角形,点击运行即可运行后在项目目录就可以看到合成出来的mp3了。
结语
总体来讲,百度的文档内容比较详细,用法方便,这对于开发者而言,是最重要的,不像某浪的python SDK万年不更新。
详尽的官方文档可以免去很多自己造轮子的工作。单单这一点,就值得我们去尝试使用