ChatTTS改良版 - 新增精选高品质音色,新增超长文本推理,新增api接口

这个版本是ChatTTS的一个分支,基于ChatTTS修改,由6drf21e大佬改良,大佬GitHub地址 GitHub - 6drf21e/ChatTTS_colab: 🚀 一键部署(含离线整合包)!基于 ChatTTS ,支持音色抽卡、长音频生成和分角色朗读。简单易用,无需复杂安装。

民间玩家QuantumDriver 多次把玩,从抽卡音色中精选了几种高质量的音色,类似其他TTS项目的命名角色,比如魅力小姐姐、成熟大叔、阳光大男孩,贴心女宝等银色,经过多次测试,音色质量都是非常出色的。


同时,这个版本针对文本切片做了修改,支持超长文本的推理,同样,经过多次测试推理结果质量非常高,没有之前版本长文本生成后乱跳的情况。

本地一键整合包下载:ChatTTS改良版 - 新增精选高品质音色,新增超长文本推理

版本特点:

音色抽卡功能:批量生成多个音色,并可保存自己喜欢的音色。
精选音色:内置了玩家多次抽卡精选出来的高品质音色。
长本文优化:对于长文本推理生成做了优化,超长文本生成质量提升较大。
支持生成长音频:适合生成较长的语音内容。
字符处理:对数字和朗读错误的标点做了初步处理。
分角色朗读功能 :支持对不同角色的文本进行分角色朗读,并支持大模型一键生产脚本。
API模式:支持接口调用。

使用方法:

双击启动 一键运行 即可

api开启方法:

双击 启动接口服务,等待自动开启,复制命令行里的接口URL即可

### 聊天文本转语音(TTS)依赖包 对于在本地运行 `ChatTTS` 项目,特别是针对 Windows 用户而言,安装必要的依赖项是至关重要的[^1]。以下是与聊天文本转语音(TTS)功能密切相关的几个重要依赖包: #### Python环境配置 确保已安装最新版本的Python解释器以及pip工具。 #### 安装基础库 通过命令行执行如下指令来获取所需的基础软件包: ```bash pip install --upgrade pip setuptools wheel ``` #### TTS核心组件 为了实现高质量的声音合成效果,通常会依赖于一些专门设计用于处理音频数据和自然语言理解(NLU)的任务模块。具体来说,可以考虑以下几个方面: - **音素序列生成**: 将输入的文字转换成对应的音素表示形式。 ```bash pip install g2p_en ``` - **声学模型训练**: 构建能够预测给定音素条件下产生的声音特征参数的概率分布函数。 ```bash pip install tensorflow torchaudio ``` - **波形重建算法**: 把由声学模型计算得到的结果进一步加工成为实际可播放出来的数字信号。 ```bash pip install pyworld parallel_wavegan ``` 这些组件共同作用下使得机器可以根据接收到的消息内容实时产生接近真人发声水平的回答。 另外,在开发Android应用程序时涉及到的主题样式定义文件如attrs.xml, styles.xml 和 themes.xml虽然不直接影响到TTS功能本身,但对于构建具有良好用户体验界面的应用程序同样不可或缺[^2]。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值