python对接微软文字转语音

该博客演示了如何使用Python对接微软的文字转语音服务,通过获取Access Token,然后利用SSML进行语音合成,最终将合成的语音保存为.wav文件。支持多种中文发音人和语气设置。
摘要由CSDN通过智能技术生成

import http.client, urllib.parse, json
from xml.etree import ElementTree
import wave

apiKey = "你的密钥"
 
params = "hello"
headers = {"Ocp-Apim-Subscription-Key": apiKey}
 
AccessTokenHost = "eastasia.api.cognitive.microsoft.com"
path = "/sts/v1.0/issueToken"
 
print ("Connect to server to get the Access Token")
conn = http.client.HTTPSConnection(AccessTokenHost)
conn.request("POST", path, params, headers)
response = conn.getresponse()
print(response.status, response.reason)
 
data = response.read()
conn.close()
 
accesstoken = data.decode("UTF-8")
print ("Access Token: " + accesstoken)
 
body = ElementTree.Element('speak', version='1.0')
body.set('{http://www.w3.org/XML/1998/namespace}lang', 'zh-CN')
voice = ElementTree.SubElement(body, 'voice')
voice.set('{http://www.w3.org/XML/1998/namespace}lang', 'zh-CN')   //语言
voice.set('{http://www.w3.org/XML/1998/namespace}style', 'lyrical')  //语气
voice.set('{http://www.w3.org/XML/1998/namespace}gender', 'Female')
voice.set('name', 'Microsoft Server Speech Text to Speech Voice (zh-CN, XiaoxiaoNeural)')   //发音人
voice.text = '这次的事故要严格总结,防止下次再次发生'       //要转化的文本内容
 
headers = {"Content-type": "application/ssml+xml", 
            "X-Microsoft-OutputFormat": "riff-24khz-16bit-mono-pcm",
            "Authorization": "Bearer " + accesstoken, 
      

  • 0
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值