CosyVoice安装过程详解

菜Queen

已于 2025-01-06 20:43:13 修改

阅读量4.3k

点赞数 6

分类专栏： AIGC 文章标签： python

于 2024-12-23 14:23:43 首次发布

此博客若能助君一力乃是大幸,转载但求雁过留痕,本尊铭感五内~

本文链接：https://blog.csdn.net/u013983235/article/details/144661160

版权

AIGC 专栏收录该内容

6 篇文章

订阅专栏

CosyVoice安装过程详解

安装过程参考官方文档

前情提要

环境：Windows子系统WSL下安装的Ubunt22.4
python环境管理：MiniConda3
git

1. Clone代码

$ git clone --recursive https://github.com/FunAudioLLM/CosyVoice.git
# 若是submodule下载失败，要先进入CosyVoice目录再执行以下命令，可以多次执行直到submodule安装成功，会有Successfully提示。
cd CosyVoice
git submodule update --init --recursive

2. 创建虚拟环境

官方使用conda，本次示例使用的是miniconda，都是一样的。

$ conda create -n cosyvoice python=3.10
# 激活环境
$ conda activate cosyvoice
# 安装 pynini
$ pynini是WeTextProcessing所需，若是没有用到ttsfrd的话，默认是使用WeTextProcessing，
$ conda install -y -c conda-forge pynini==2.1.5
# 安装依赖包
# 这是基于刚刚我们进入的CosyVoice目录下执行的命令，若是执行失败，请先注意一下执行文件所在目录
$ pip install -r requirements.txt -i https://mirrors.aliyun.com/pypi/simple/ --trusted-host=mirrors.aliyun.com
# 若是conda环境已经添加阿里云源的话，-i后面的参数可忽略
# 如果有遇到sox安装问题的话，可执行以下命令
# ubuntu
$ sudo apt-get install sox libsox-dev
# centos
$ sudo yum install sox sox-devel

3. 下载模型

本示例使用git下载，若是git下载不下来，可去魔搭社区搜索下载

# 创建模型存放目录，注意目前所在目录依旧是在CosyVoice/下
$ mkdir -p pretrained_models
# git clone 模型，命令分开执行，可以按需下载所要的模型
$ git clone https://www.modelscope.cn/iic/CosyVoice2-0.5B.git pretrained_models/CosyVoice2-0.5B
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M.git pretrained_models/CosyVoice-300M
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M-25Hz.git pretrained_models/CosyVoice-300M-25Hz
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M-SFT.git pretrained_models/CosyVoice-300M-SFT
$ git clone https://www.modelscope.cn/iic/CosyVoice-300M-Instruct.git pretrained_models/CosyVoice-300M-Instruct
$ git clone https://www.modelscope.cn/iic/CosyVoice-ttsfrd.git pretrained_models/CosyVoice-ttsfrd

注意这里：若是需要ttsfrd模型，那要执行以下步骤，若是不需要就忽略它

# 安装ttsfrd模型
$ cd pretrained_models/CosyVoice-ttsfrd/
$ unzip resource.zip -d .
$ pip install ttsfrd_dependency-0.1-py3-none-any.whl
$ pip install ttsfrd-0.4.2-cp310-cp310-linux_x86_64.whl

PS: 下载下来的ttsfrd有两个包，一个是cp38和cp310，旧的官方文档里python是3.8，那就选择cp38的包，本示例python=3.10，所以用的是cp310的包
在这里插入图片描述

4. 添加环境变量

这条命令不知道是不是tts安装时所需，我第一次安装时没有执行这条命令也是可以运行。

$ export PYTHONPATH=third_party/Matcha-TTS

5. 运行UI

在CosyVoice目录下执行以下命令，可打开UI页面快速熟悉。

$  python3 webui.py --port 50000 --model_dir pretrained_models/CosyVoice-300M
# --model_dir指向刚刚我们下载的模型地址，可启动不同的模型试试看

CosyVoice安装过程详解

CosyVoice安装过程详解

前情提要

1. Clone代码

2. 创建虚拟环境

3. 下载模型

4. 添加环境变量

5. 运行UI

6. 结束