最近需要给一些专业的词汇生成语音,由于人工录制耗时过高,就想到了AI语音合成的方式。百度提供的接口还不错,还能白嫖个几万条语音,就拿过来用了。
百度智能云地址:https://console.bce.baidu.com
在里面选择语音技术,注册后获取免费生成的语音权限即可。
然后就是本地调接口的问题了,和示例代码的区别为,你需要把中文转成一个百度接口能识别的编码。我们用python里的urllib.parse.quote()方法能够将汉字转换成unicode编码的格式来解决这个问题。
最后放上调用接口实现一个文件夹的txt里的内容全转成语音的实力代码,大家可以根据自己的需要进行修改,还是蛮方便的。
import requests
import urllib.parse
import os
import glob
#填写自己的key
API_KEY = "....."
SECRET_KEY = "....."
# 定义要遍历的文件夹路径
folder_path = './test1'
def main():
url = "https://tsn.baidu.com/text2audio"
txt_files = glob.glob(os.path.join(folder_path, '*.txt'))
for file_path in txt_files:
with open(file_path, 'r') as file:
content = file.read()
#代码中ctp=1&lan=zh&spd=6&pit=5&vol=5&per=1&aue=6这一块参数参考网页界面的设置,可以自己调整
payload='tex='+ urllib.parse.quote(content) +'&tok='+ get_access_token() +'&cuid=XpbgkzZ210tiQLVgwMJv22XriCWtoaAx&ctp=1&lan=zh&spd=6&pit=5&vol=5&per=1&aue=6'
headers = {
'Content-Type': 'application/x-www-form-urlencoded',
'Accept': '*/*'
}
response = requests.request("POST", url, headers=headers, data=payload)
if response.status_code == 200:
with open(file_path[:-4]+'.wav', 'wb') as f:
f.write(response.content)
def get_access_token():
"""
使用 AK,SK 生成鉴权签名(Access Token)
:return: access_token,或是None(如果错误)
"""
url = "https://aip.baidubce.com/oauth/2.0/token"
params = {"grant_type": "client_credentials", "client_id": API_KEY, "client_secret": SECRET_KEY}
return str(requests.post(url, params=params).json().get("access_token"))
if __name__ == '__main__':
main()