语音合成：Azure+Python+SSML实现

连接数据库

已于 2022-02-21 15:17:29 修改

阅读量5.6k

点赞数

分类专栏：深度学习学习笔记 Python框架文章标签： azure python 语音识别

于 2022-02-21 14:31:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vpqtxzmzezeqjj9977/article/details/123046081

版权

本文档逐步介绍了如何使用微软Azure的Python SDK进行文本转语音操作。首先，需要注册Azure账号并创建资源，选择免费的美国东部服务。接着，通过pip安装SDK，并使用提供的代码示例进行文本或SSML文本转语音，最终将转换的音频保存为wav格式。文章还提供了相关链接供参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

采用的策略是微软云服务的Python SDK + SSML

Azure上，语音部分的文档写的较为详细，包含各种功能，如文本转语音 REST API，TTS SDK，自定义语音模型进行文本转语音等。但是没有整体的、提纲般的介绍，看完文档极有不知如何下手。本文将一步步地介绍，如何从0开始使用Azure SDK的使用方法。我们希望实现的效果是，输入一段文本，调用SDK后，返回给我们一段wav格式的音频，播放后，即为之前输入的文本。

1、注册账号

注册微软Azure账号看这里：https://zhuanlan.zhihu.com/p/49711377
需要一张vasa信用卡，也可以是虚拟卡。对于国内用户，这是极不友好的。不过也有一些其他优惠，比如学生的，自行获取国外edu教育有效了，据说GitHub学生认证也可以，不过都比较麻烦。注册的时候最好使用非大陆的IP，比如香港的IP+香港的地址

2、创建资源

在这里插入图片描述
都选择白嫖免费使用的就完事，注意要选择美国东部的服务，eastus
其他的名称只要是不重复就可以随便填，填写好就可以看到自己的key了

最低0.47元/天解锁文章

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。