本期推荐开源项目目录:
1. GPT-SoVITS
2. 以代码为主的代理框架
3. ChatGPT、文生图 API 封装应用
01
GPT-SoVITS
GPT-SoVITS 是一个开源黑科技,只需要 1 分钟的语音就能实现声音克隆、文本到语音转换。少量样本就可以训练出一个优秀的 TTS 模型。
它具有以下主要特性:
零样本 TTS:输入 5 秒的声音样本,即可体验即时的文本到语音转换。
少样本 TTS:只需 1 分钟的训练数据,就可以微调模型,以提高语音相似度和真实感。
跨语言支持:可以用与训练数据集不同的语言进行推理,目前支持英语、日语和中文。集成了一些工具,包括声音伴奏分离、自动训练集分割、中文 ASR 和文本标签,帮助初学者创建训练数据集和 GPT/SoVITS 模型。
开源地址:https://github.com/RVC-Boss/GPT-SoVITS
02
以代码为主的代理框架
TaskWeaver 是一个由 Microsoft 开发的开源项目,它是一个以代码为主的代理框架,用于无缝地规划和执行数据分析任务。
TaskWeaver 的目标是通过编码片段解释用户请求,并有效地协调各种形式的插