本期推荐开源项目目录:
1. OpenVoice
2. 大模型课程
3. 看电影的应用
4. 基于大模型的多模态代理框架
5. 使用 ChatGPT 制作的 PDF 工具
01
OpenVoice
OpenVoice 主要优势可以分为三个方面:
准确的音色克隆:OpenVoice 能够准确地克隆参考音色,并生成多种语言和口音的语音。
灵活的语音风格控制:OpenVoice 允许对语音风格进行细粒度控制,例如情感和口音,以及其他风格参数,包括节奏、停顿和语调。
零样本跨语言语音克隆:生成的语音或参考语音的语言都不需要出现在大规模多语言训练数据集中。
OpenVoice 自 2023 年 5 月以来一直在为 myshell.ai 的即时语音克隆功能提供支持。截至 2023 年 11 月,全球用户已经使用了数千万次语音克隆模型,并在平台上见证了用户数量的爆炸性增长。
开源地址:https://github.com/myshell-ai/OpenVoice
02
大模型课程
Large Language Model Course(大型语言模型课程)是一个开源项目,该课程分为三个部分:
LLM 基础: