目录
1.百度AI开放平台
百度AI开放平台的使用主要分为5步。先登录账号,再创建应用、获取密钥、生成签名,最后开发调用。
应用是调用API服务的基本操作单元,需要先创建应用才可正式调用AI能力,基于应用创建成功后获取的API Key及Secret Key,进行接口调用操作,及相关配置。使用创建应用所分配到的AppID、API Key及Secret Key,进行Access_Token(用户身份验证和授权的凭证)的生成。
1)登录百度AI开放平台:百度智能云-登录
点击左上角蓝色按钮,选择对应的产品服务
2)创建一个应用,应用名称和应用描述随便填写即可,勾选需要的服务接口(一个应用可以实现多种功能),创建完成后就能得到AppID,API Key,Secret Key;
3)在“概览”中领取免费资源;
4)获取access_token(注意每次获取的access_token 30天就会过期,必须重新获取一次)
import requests
API_KEY = '复制创建的应用的API_KEY'
SECRET_KEY = '复制创建的应用的SECRET_KEY'
host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials' + \
'&client_id=' + API_KEY + \
'&client_secret=' + SECRET_KEY
response = requests.get(host)
if response:
token = response.json()['access_token']
print(token)
百度AI开放平台提供了很多产品功能,这里挑出几个做示范。
1.1语音合成
from aip import AipSpeech
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
word = '你好'
result = client.synthesis(word, 'zh', 1,{'vol': 5})
if not isinstance(result, dict):
with open('test.mp3', 'wb') as f:
f.write(result)
上面的代码生成了一个test.mp3的音频文件,内容为“你好”。更多参数请参考:https://ai.baidu.com/ai-doc/SPEECH/Qk38y8lrl
1.2语音识别
# encoding:utf-
import base64
import pyaudio,wave
from aip import AipSpeech
APP_ID = '你的APP_ID'
API_KEY = '你的API_KEY'
SECRET_KEY = '你的SECRET_KEY'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
def record(): # 录音
chunk = 1024
sample_format = pyaudio.paInt16
channels = 1
fs = 16000
seconds = 3 # 录音时长为3秒
p = pyaudio.PyAudio()
print('开始录音')
stream = p.open(format=sample_format,channels=channels,
rate=fs,frames_per_buffer=chunk,input=True)
frames = []
for i in range(0, int(fs / chunk * seconds)):
data = stream.read(chunk)
frames.append(data)
stream.stop_st