20200824：汉字转语音（语音合成）（三）：Tacotron实践之项目准备篇

最新推荐文章于 2024-09-14 07:41:23 发布

沈雁

最新推荐文章于 2024-09-14 07:41:23 发布

阅读量537

点赞数

分类专栏：语音合成

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_38192254/article/details/115208140

版权

语音合成专栏收录该内容

3 篇文章 1 订阅

订阅专栏

1、参考资料：

CSDN之小白能看懂等Tacotron 中文语音合成实践https://blog.csdn.net/weixin_41021342/article/details/104984800
https://blog.csdn.net/weixin_41763134/article/details/90900539
知乎之语音合成那些事儿：https://zhuanlan.zhihu.com/p/101064153
知乎之当我们在谈论AI说话：语音合成： https://zhuanlan.zhihu.com/p/45517433

2、项目克隆：

git clone https://github.com/begeekmyfriend/tacotron.git ,该分支下datasets 目录中有对清华数据集thchs30.py的处理
下载源码 https://github.com/begeekmyfriend/tacotron/tree/mandarin，注意分支选择，选择mandarin分支而不是默认的master分支。
git clone https://github.com/Rookie-Chenfy/Tacotron-2

3、数据下载：

清华数据集：THCHS30数据集（6.4G）
下载地址： https://blog.ailemon.me/2018/11/21/free-open-source-chinese-speech-datasets/

4、预训练模型下载：

5、环境搭建：

使用cpu环境搭建的环境，主要原因是GPU搭建后显存太小跑不动。
主要的安装包如下：
- mxnet-cu90 1.5.1.post0
- python 3.6.9
- tensorflow 1.14
- tqdm 4.11.2
- scikit-learn 0.23.2
- scipy 0.19.1
- numpy 1.16.1
- numba 0.43.0
- keras 2.4.3
- libraso 0.6.2
- matplotlib 2.0.2
- opencv-python 4.1.1.26
- pandas 0.25.1
- pillow 6.2.0
- pip 19.2.3
- requests 2.22.0
- setuptools 41.4.0
- falcon 1.2.0
- inflect 0.2.5
- Unidecode 0.4.20

6、启动训练脚本可能遇到的问题及解决办法

问题1：

问题2：

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。