零.项目背景
2023年12月15日:新增功能,可以自定义音色克隆,自定义语速设置和音量调整
将文本书籍转换为有声读物具有很大的市场需求。本文以PaddleSpeech语音合成为核心,展示有声书籍的技术可行方案。
一.环境安装
核心语言合成功能使用到PaddleSpeech
PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库,用于语音和音频中的各种关键任务的开发,包含大量基于深度学习前沿和有影响力的模型
In [ ]
# 注意如果之前运行过这步 下次就不用再运行了,这个目录重启项目也不会清空的
# 下载解压说话人编码器
!wget -P data https://bj.bcebos.com/paddlespeech/Parakeet/released_models/ge2e/ge2e_ckpt_0.3.zip
!unzip -o -d work data/ge2e_ckpt_0.3.zip
# 下载解压合成器
!wget -P data https://paddlespeech.bj.bcebos.com/Parakeet/released_models/pw