之前的大模型介绍一直停留在文字交互上,这节部署一个ChatTTS实现文字转语音,而且语音十分接近真人,是最近比较热的一个文字转语音的开源项目了。此前我在window上部署过一次,部署成功了,但是过程稍微复杂些,官网提供的部署方法更适合liunx系统,对window不友好,但如果有liunx系统可以参考尝试下。下面我用一个非常简单的方式来部署,是一个封装好各种包的部署包。
不过官网提供了在线体验的功能非常棒,
首先下载改进后的包,如果需要包的下载地址可以私信我或者给我留言,下载好后解压到文件夹,目录结构如下,
然后,你只需要双击app的那个文件就可以运行了,因为这个包里已经包含了必要的组件,双击运行后会出现如下的日志,最终打印出来一个启动地址,在浏览器输入地址后就可以打开主页面了。
首页中上面是输入要转化的文本,下面是音色提示词以及数字转文本等参数,可以每次修改一个值尝试下效果。选择不同的音色或者音色值转化后的人语音是不一样的,需要注意的是如果文本中存在数字要勾选数字转文本,否则语音会读不准数字的发音。完成后点击立即合成声音就可以生成了,生成完毕声音会显示在下面,点击就可以播放了,
这个版本虽然对原始的chatTTS做了一些修改,但是还提供了API调用的功能,点击生成的语音下显示API调用就可以看到调用的接口文档了。
可以根据接口文档,传入参数值,尝试下。