百度智能云批量合成AI语音

最新推荐文章于 2024-06-20 14:37:08 发布

Goodbye despair

最新推荐文章于 2024-06-20 14:37:08 发布

阅读量599

点赞数

文章标签：人工智能 python 语音识别

本文链接：https://blog.csdn.net/Goodbye_Despair/article/details/132407235

版权

最近需要给一些专业的词汇生成语音，由于人工录制耗时过高，就想到了AI语音合成的方式。百度提供的接口还不错，还能白嫖个几万条语音，就拿过来用了。

百度智能云地址：https://console.bce.baidu.com

在里面选择语音技术，注册后获取免费生成的语音权限即可。

此图为语音功能调试界面
然后就是本地调接口的问题了，和示例代码的区别为，你需要把中文转成一个百度接口能识别的编码。我们用python里的urllib.parse.quote（）方法能够将汉字转换成unicode编码的格式来解决这个问题。
最后放上调用接口实现一个文件夹的txt里的内容全转成语音的实力代码，大家可以根据自己的需要进行修改，还是蛮方便的。

import requests
import urllib.parse
import os  
import glob

#填写自己的key  
API_KEY = "....."
SECRET_KEY = "....."

# 定义要遍历的文件夹路径  
folder_path = './test1'  

def main():
    url = "https://tsn.baidu.com/text2audio"
    txt_files = glob.glob(os.path.join(folder_path, '*.txt')) 
    for file_path in txt_files: 
        with open(file_path, 'r') as file:  
            content = file.read()
            #代码中ctp=1&lan=zh&spd=6&pit=5&vol=5&per=1&aue=6这一块参数参考网页界面的设置，可以自己调整            
            payload='tex='+ urllib.parse.quote(content) +'&tok='+ get_access_token() +'&cuid=XpbgkzZ210tiQLVgwMJv22XriCWtoaAx&ctp=1&lan=zh&spd=6&pit=5&vol=5&per=1&aue=6'
            headers = {
                'Content-Type': 'application/x-www-form-urlencoded',
                'Accept': '*/*'
            }
            response = requests.request("POST", url, headers=headers, data=payload)
            if response.status_code == 200:
                with open(file_path[:-4]+'.wav', 'wb') as f:
                    f.write(response.content)

    

def get_access_token():
    """
    使用 AK，SK 生成鉴权签名（Access Token）
    :return: access_token，或是None(如果错误)
    """
    url = "https://aip.baidubce.com/oauth/2.0/token"
    params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
    return str(requests.post(url, params=params).json().get("access_token"))

if __name__ == '__main__':
    main()