1.准备工作
(1)在浏览器输入http://ai.baidu.com
(2)点击右上角控制台
,进入用户注册登录界面
(3)如果没有百度账号,可以先注册然后再进行登录;如果已经有了百度账号可以直接登录;登录成功后,进入控制台管理界面
(4)点击实名认证按钮进入实名认证页面(因我的账号已经进行过初级实名认证,实名认证内容大家按照提示进行即可)
到此准备工作结束,可以使用百度AI开发平台
提供的API进行开发了
2.语音合成
2.1第一步:左侧菜单选择语音技术
2.2第二步:点击语音合成
首次进来,需要点击“领取免费资源” (我已经领过了一个免费的资源,根据自己的需要领取)
领取免费资源
领取免费资源后,点击返回
注意:领完资源后,再资源列表中查看资源,有了资源信息后,再创建应用
2.3第三步:创建应用填写应用信息
2.4第四步:创建成功后进入应用列表查看
2.5第五步:点击上图左侧菜单技术文档
2.6第六步:按照下图打开语音快速入门文档
2.7第七步:阅读文档进行开发并调试
pycharm中安装baidu-aip
如下图所示,安装成功
创建一个test.py模块
代码:
# -*- coding: utf-8 -*-
# @File : test.py
# @Time : 2024/6/19 15:37
# @Author : syq
# @Email : 1721169065@qq.com
# @Software: PyCharm
from aip import AipSpeech
""" 你的 APPID AK SK """
#就是刚刚创建应用后,生成的3个值
APP_ID = '84493676'
API_KEY = '4dXEGpehJRDWYvvZI6ewNoL9'
SECRET_KEY = 'bbWB7DG2GHUuBLkU6XOMQbwL3TS4AUPf'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
#client.asr 方法是用于将PCM格式的音频文件转换成文字的
# 调用synthesis方法,这里假设使用默认的参数
result = client.synthesis('范霞,小胖子,小胖子', 'zh', 1, {
'spd': 5, # 语速,取值0-9,默认为5中语速
'pit': 5, # 音调,取值0-9,默认为5中语调
'vol': 5, # 音量,取值0-15,默认为5中音量
# 'aue': '1', # 音频编码,取值范围如下:
# 0:AMR
# 1:MP3
# 2:WAV
# 3:SPEEX
# 4:OPUS
'per': 4, # 发音人选择, 0为女声,1为男声,3为情感合成-度逍遥,4为情感合成-度丫丫,默认为0。
# 注:部分发音人需要申请后使用,详情参见文档
})
# 如果调用成功,result是一个包含二进制音频数据的bytes类型
if not isinstance(result, dict):
with open('audio.mp3', 'wb') as f:
f.write(result)
else:
print(result) # 输出错误信息
运行结果:
生成的audio.mp3文件可以用酷狗音乐打开听里面的声音
代码可在资源中自行下载!!!