CosyVoice：开源强大的 AI 语音合成工具

@井九

已于 2024-09-06 13:32:32 修改

阅读量3.2k

点赞数 16

文章标签：人工智能

于 2024-09-06 13:29:48 首次发布

本文链接：https://blog.csdn.net/problc/article/details/141957374

版权

在当今科技飞速发展的时代，AI 语音合成技术正逐渐改变着我们的生活。今天，就为大家介绍一款卓越的语音合成工具——CosyVoice。

一、安装步骤

克隆和安装：
- 克隆仓库：git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git。如果克隆子模块失败，可以运行命令cd CosyVoice; git submodule update --init --recursive。
安装 Conda：请参考https://docs.conda.io/en/latest/miniconda.html。
创建 Conda 环境：
- conda create -n cosyvoice python=3.8。
- conda activate cosyvoice。
- conda install -y -c conda-forge pynini==2.1.5。
- pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com。
解决 sox 兼容性问题：
- Ubuntu：sudo apt-get install sox libsox-dev。
- CentOS：sudo yum install sox sox-devel。

二、模型下载

强烈建议下载预训练的CosyVoice - 300M、CosyVoice - 300M - SFT、CosyVoice - 300M - Instruct模型和CosyVoice - ttsfrd资源。

SDK 模型下载：

from modelscope import snapshot_download
snapshot_download('iic/CosyVoice - 300M', local_dir='pretrained_models/CosyVoice - 300M')
snapshot_download('iic/CosyVoice - 300M - SFT', local_dir='pretrained_models/CosyVoice - 300M - SFT')
snapshot_download('iic/CosyVoice - 300M - Instruct', local_dir='pretrained_models/CosyVoice - 300M -