python文本批量转语音代码

AI虎哥

于 2023-05-31 19:24:09 发布

阅读量304

点赞数

分类专栏：技术文章文章标签： python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/winkexin/article/details/130975591

版权

技术文章专栏收录该内容

356 篇文章

订阅专栏

本片教程利用的微软语音项目：https://GitHub.com/skygongque/tts，不过它最多生成10分钟的音频，大概2500字，对于大的文本就要想办法分割再识别，我就把狗尾续貂，增加了这部分的功能。

教程开始

1、安装python，下载https://github.com/skygongque/tts的项目。
2、cmd中安装python库

1 2	`pip install requests==2.15.1` `pip install websockets==10.2`

3、解压下载文件，在tts-main\python_cli_demo下建立snd和txt两个文件夹。

4、把要转换的文本文件复制到tts-main\python_cli_demo下，注意编码要是ansi，utf-8的我没研究出来，这里我把原来的tts.py编码选项改了下才能用，有兴趣的可以深入研究下。

1

2

3

def get_SSML(path):

with open(path,'r',encoding='utf-8') as f:

return f.read()

我试的是把原文件中的,encoding='utf-8'删去才能用。

5、把getxt.py同样复制到tts-main\python_cli_demo下。

1	`location='G:\\D\\tts-main\\python_cli_demo\\'，这里目录改成你的，注意为\\。`

里面默认是晓秋的声音，可在geTxt(input('BOOK:'),2333,3,'zh-CN-XiaoqiuNeural')中改参数。
2333是分割字数，3是生成的xml后缀数字位数，zh-CN-XiaoqiuNeural是朗读人的名字，可修改。

6、在tts-main\python_cli_demo下cmd中执行python getxt.py，输入文本文件名(不含txt)。
在txt中会生成分割后的xml文件，在tts-main\python_cli_demo会生成start.bat文件，会自已运行。

7、稍等在snd文件夹中就会生成声音了，2333个字符一段，大概8分多钟。【新更新的试了下字数不要太多1000多字可以，2000多会有问题】
再次执行上述操作会删除snd和txt文件夹中文件，请生成后及时移走。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

AI虎哥 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。