一.准备
1.百度ai开放平台提供了优质的接口资源https://ai.baidu.com/ (基本免费)
2.在语音识别的接口中, 对中文来说, 讯飞的接口是很好的选择https://www.xfyun.cn/ (收费)
3.图灵机器人提供了可以用http访问的接口, http://www.turingapi.com/
二.创建
1.百度: 在具体功能中创建应用, 点击技术文档-> python sdk 按照文档使用
2.图灵机器人, 如果所示,创建机器人
在设置中可以对机器人的属性设置,包括年龄星座等, 之后可以点击查看api使用文档进行使用
三.使用
由于百度的语音识别需要的格式为.pcm, 而示例中主要用win系统自带的录音机文件进行声音采集,需要对文件转码.所以需要安装ffmpeg, 安装后将目录/bin配置进系统环境变量
配置完环境变量之后,编译器(pycharm)要重启一下,重新加载一下环境变量,否则会报错
如图,环境变量配置成功, cd命令切换到音频文件目录下, 使用下面的命令将文件转换为pcm格式
ffmpeg -y -i audio.wav -acodec pcm_s16le -f s16le -ac 1 -ar 16000 audio.pcm
# 1.你说一句话 # 2.根据语音转化为文字 # 3.机器人通过对文字的处理返回应答 # 4.将应答文字转化为语音,实现对话 import os import requests from aip import AipNlp, AipSpeech """ 你的 APPID AK SK """ APP_ID = '输入 app_id' API_KEY = '输入api_key' SECRET_KEY = '输入secret_key' client = AipNlp(APP_ID, API_KEY, SECRET_KEY) client2 = AipSpeech(APP_ID, API_KEY, SECRET_KEY) client3 = AipSpeech(APP_ID, API_KEY, SECRET_KEY) # 1. 说-> 转换为文字 # 读取文件 def get_file_content(filePath): os.system(f'ffmpeg -y -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm') with open(f'{filePath}.pcm', 'rb') as fp: return fp.read() # 调用图灵机器人交互 def to_url(text, uid): url =