PaddleSpeech 的环境搭建与使用（windows10）

WO代码侠客

已于 2024-06-28 15:33:09 修改

阅读量816

点赞数 14

文章标签： python AI编程语音识别音频

于 2024-06-28 15:25:24 首次发布

本文链接：https://blog.csdn.net/u012181466/article/details/140043422

版权

一、环境搭建准备
安装Anaconda

Anaconda3-2024.02-1-Windows-x86_64.exe

CUDA安装

下载地址：https://developer.nvidia.cn/zh-cn/cuda-toolkit

下载安装 cuda_11.7.0_516.01_windows.exe

cuDNN安装

地址为：cuDNN Archive | NVIDIA Developer

先找到与CUDA对应的版本

cudnn-windows-x86_64-8.4.1.50_cuda11.6-archive.zip

将cuDNN目录下三个文件粘贴到CUDA的目录下

二、为paddlespeech创建虚拟环境

以下命令为创建名为”paddle_speech“ 的虚拟环境

创建命令：conda create -n paddle_speech python=3.8

激活conda环境：conda activate paddle_speech

三、安装C++编译环境
(如果你系统上已经安装了 C++ 编译环境，请忽略这一步。)

对于 Windows 系统，需要安装 Visual Studio 来完成 C++ 编译环境的安装。

下载地址：https://visualstudio.microsoft.com/visual-cpp-build-tools/

主要是Visual Studio Installer 中勾选 C++桌面开发。

勾选完成直接点继续，开始安装

安装paddlepaddle
paddlespeech依赖于paddlepaddle，我们需要先安装paddlepaddle：

CPU版

python -m pip install paddlepaddle==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

GPU版

python -m pip install paddlepaddle-gpu==2.4.2 -i https://pypi.tuna.tsinghua.edu.cn/simple

安装paddlespeech

最后安装paddlespeech

pip install paddlespeech==1.0.1 -i https://pypi.tuna.tsinghua.edu.cn/simple

测试效果

paddlespeech tts --input "湖北十堰竹山县的桃花摇曳多姿，和蓝天白云一起，构成一幅美丽春景。" --output output.wav --am fastspeech2_csmsc --voc hifigan_csmsc --lang zh --spk_id 174

最后清单列表如下：

(paddlespeech) D:\>pip list
Package Version
------------------- -----------
aiohttp 3.9.5
aiosignal 1.3.1
annotated-types 0.7.0
anyio 4.4.0
astor 0.8.1
async-timeout 4.0.3
attrs 23.2.0
audioread 3.0.1
Babel 2.15.0
bce-python-sdk 0.9.14
blinker 1.8.2
Bottleneck 1.4.0
certifi 2024.6.2
cffi 1.16.0
charset-normalizer 3.3.2
click 8.1.7
colorama 0.4.6
coloredlogs 15.0.1
colorlog 6.8.2
contourpy 1.1.1
cycler 0.12.1
Cython 3.0.10
datasets 2.20.0
decorator 5.1.1
dill 0.3.4
Distance 0.1.3
dnspython 2.6.1
editdistance 0.8.1
email_validator 2.1.2
exceptiongroup 1.2.1
fastapi 0.111.0
fastapi-cli 0.0.4
filelock 3.15.3
Flask 3.0.3
Flask-Babel 2.0.0
flatbuffers 24.3.25
fonttools 4.53.0
frozenlist 1.4.1
fsspec 2024.5.0
future 1.0.0
g2p-en 2.1.0
g2pM 0.1.2.5
h11 0.14.0
h5py 3.11.0
httpcore 1.0.5
httptools 0.6.1
httpx 0.27.0
huggingface-hub 0.23.4
humanfriendly 10.0
idna 3.7
importlib_metadata 7.1.0
importlib_resources 6.4.0
inflect 7.2.1
itsdangerous 2.2.0
jieba 0.42.1
Jinja2 3.1.4
joblib 1.4.2
jsonlines 4.0.0
kaldiio 2.18.0
kiwisolver 1.4.5
librosa 0.8.1
llvmlite 0.41.1
loguru 0.7.2
lxml 5.2.2
markdown-it-py 3.0.0
MarkupSafe 2.1.5
matplotlib 3.7.5
mdurl 0.1.2
mock 5.1.0
more-itertools 10.3.0
mpmath 1.3.0
multidict 6.0.5
multiprocess 0.70.12.2
nara-wpe 0.0.10
nltk 3.8.1
numba 0.58.1
numpy 1.22.0
onnxruntime 1.18.0
opt-einsum 3.3.0
orjson 3.10.5
packaging 24.1
paddle-bfloat 0.1.7
paddle2onnx 1.0.6
paddleaudio 1.0.1
paddlefsl 1.1.0
paddlenlp 2.5.2
paddlepaddle 2.4.2
paddlespeech 1.0.1
paddlespeech-feat 0.1.0
pandas 2.0.3
pathos 0.2.8
pattern_singleton 1.2.0
pillow 10.3.0
pip 24.1
platformdirs 4.2.2
pooch 1.8.2
portalocker 2.8.2
pox 0.3.4
ppft 1.7.6.8
praatio 5.0.0
prettytable 3.10.0
protobuf 3.20.0
pyarrow 16.1.0
pyarrow-hotfix 0.6
pycparser 2.22
pycryptodome 3.20.0
pydantic 2.7.4
pydantic_core 2.18.4
Pygments 2.18.0
pyparsing 3.1.2
pypinyin 0.51.0
pypinyin-dict 0.8.0
pyreadline3 3.4.1
python-dateutil 2.9.0.post0
python-dotenv 1.0.1
python-multipart 0.0.9
pytz 2024.1
pywin32 306
pyworld 0.3.4
PyYAML 6.0.1
regex 2024.5.15
requests 2.32.3
resampy 0.2.2
rich 13.7.1
sacrebleu 2.4.2
scikit-learn 1.3.2
scipy 1.10.1
sentencepiece 0.1.99
seqeval 1.2.2
setuptools 69.5.1
shellingham 1.5.4
six 1.16.0
sniffio 1.3.1
soundfile 0.12.1
starlette 0.37.2
sympy 1.12.1
tabulate 0.9.0
TextGrid 1.6.1
threadpoolctl 3.5.0
timer 0.3.0
tqdm 4.66.4
typeguard 2.13.3
typer 0.12.3
typing_extensions 4.12.2
tzdata 2024.1
ujson 5.10.0
urllib3 2.2.2
uvicorn 0.30.1
visualdl 2.4.2
watchfiles 0.22.0
wcwidth 0.2.13
weAI编程brtcvad 2.0.10
websockets 12.0
Werkzeug 3.0.3
wheel 0.43.0
win32-setctime 1.1.0
xxhash 3.4.1
yacs 0.1.8
yarl 1.9.4
zhon 2.0.2
zipp 3.19.2