百度AI-语音合成（python代码练习-把文本转换为语音）

布凡哦

已于 2024-12-24 15:29:38 修改

阅读量2.2k

点赞数 6

分类专栏：语音识别文章标签：语音识别

于 2024-06-20 14:37:08 首次发布

本文链接：https://blog.csdn.net/weixin_42242910/article/details/139801811

版权

语音识别专栏收录该内容

1 篇文章

订阅专栏

1.准备工作

（1）在浏览器输入http://ai.baidu.com

（2）点击右上角控制台，进入用户注册登录界面

（3）如果没有百度账号，可以先注册然后再进行登录；如果已经有了百度账号可以直接登录；登录成功后，进入控制台管理界面

（4）点击实名认证按钮进入实名认证页面（因我的账号已经进行过初级实名认证，实名认证内容大家按照提示进行即可）

到此准备工作结束，可以使用百度AI开发平台提供的API进行开发了

2.语音合成

2.1第一步：左侧菜单选择`语音技术`

2.2第二步：点击语音合成

首次进来，需要点击“领取免费资源” （我已经领过了一个免费的资源，根据自己的需要领取）

领取免费资源

领取免费资源后，点击返回

注意：领完资源后，再资源列表中查看资源，有了资源信息后，再创建应用

2.3第三步：创建应用填写应用信息

2.4第四步：创建成功后进入应用列表查看

2.5第五步：点击上图左侧菜单技术文档

2.6第六步：按照下图打开语音快速入门文档

2.7第七步：阅读文档进行开发并调试

pycharm中安装baidu-aip

如下图所示，安装成功

创建一个test.py模块

代码：

# -*- coding: utf-8 -*-
# @File : test.py
# @Time : 2024/6/19 15:37
# @Author : syq
# @Email : 1721169065@qq.com
# @Software: PyCharm
from aip import AipSpeech

""" 你的 APPID AK SK """
#就是刚刚创建应用后，生成的3个值
APP_ID = '84493676'
API_KEY = '4dXEGpehJRDWYvvZI6ewNoL9'
SECRET_KEY = 'bbWB7DG2GHUuBLkU6XOMQbwL3TS4AUPf'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

#client.asr 方法是用于将PCM格式的音频文件转换成文字的
# 调用synthesis方法，这里假设使用默认的参数
result = client.synthesis('范霞，小胖子，小胖子', 'zh', 1, {
    'spd': 5,  # 语速，取值0-9，默认为5中语速
    'pit': 5,  # 音调，取值0-9，默认为5中语调
    'vol': 5,  # 音量，取值0-15，默认为5中音量
    # 'aue': '1',  # 音频编码，取值范围如下：
    # 0：AMR
    # 1：MP3
    # 2：WAV
    # 3：SPEEX
    # 4：OPUS
    'per': 4,  # 发音人选择, 0为女声，1为男声，3为情感合成-度逍遥，4为情感合成-度丫丫，默认为0。
    # 注：部分发音人需要申请后使用，详情参见文档
})
# 如果调用成功，result是一个包含二进制音频数据的bytes类型
if not isinstance(result, dict):
    with open('audio.mp3', 'wb') as f:
        f.write(result)
else:
    print(result)  # 输出错误信息

运行结果：