前言
早就写好了这个文章,今天就顺便发啦~
之前有个小的demo需要让程序说话,于是就研究了一下。
今天搞图像的萌新要开始搞语音生成。很奇怪。
首先在网上浏览,看到很多的大厂都有API,可以提供语音生成。
但是,仔细一想,我们开发的应用并不能保证一直处于联网状态。
依赖API比较麻烦。于是我决定调用python提供的包进行开发。
ps:语音生成是根据你提供的文字内容,机器自动念白,而非其他语音播放之类。有个小笨单就听岔了。
环境: python3 + pyttsx3(python的一个包,可以直接pip)
可能会有报错:
import win32com.client
ModuleNotFoundError: No module named 'win32com'
解决方案:
第一种 https://github.com/mhammond/pywin32/releases 下载对应python版本的文件
第二钟 直接安装 pywin32(pip install pywin32)
代码: