在百度 AiStudio 平台中使用 PaddleSpeech

报错处理:处理使用 PaddleSpeech 过程中出现的报错 ValueError (InvalidArgument) Broadcast dimension mismatch

一、创建项目

创建项目:

创建项目

填写项目名称:

填写项目名称

启动项目:

启动项目

二、进入终端配置环境

1、进入终端:

进入终端

2、克隆 PaddleSpeech
git clone https://github.com/PaddlePaddle/PaddleSpeech.git
cd PaddleSpeech
3、安装 Conda 后创建虚拟环境并激活

安装 Conda

# 下载 miniconda
wget https://repo.continuum.io/miniconda/Miniconda3-latest-Linux-x86_64.sh -P tools/
# 安装 miniconda
bash tools/Miniconda3-latest-Linux-x86_64.sh -b
# conda 初始化
$HOME/miniconda3/bin/conda init
# 激活 conda
bash

创建一个 conda 的虚拟环境:

conda create -y -p tools/venv python=3.8

激活 conda 虚拟环境:

conda activate tools/venv

安装 paddlespeechconda 依赖:

conda install -y -c conda-forge sox libsndfile swig bzip2
4、安装 C++ 编译环境

注:在该环境中默认已经安装了 C++ 编译环境,可跳过。

5、安装 PaddlePaddle

此处指定版本为 2.4.2

pip install paddlepaddle==2.4.2 -i https://mirror.baidu.com/pypi/simple
6、安装 PaddleSpeech

部分用户系统由于默认源的问题,安装中会出现 kaldiio 安转出错的问题,建议首先安装 pytest-runner

pip install pytest-runner -i https://pypi.tuna.tsinghua.edu.cn/simple 

请确保目前处于 PaddleSpeech 项目的根目录:

pip install . -i https://pypi.tuna.tsinghua.edu.cn/simple

根据网上查找的资料,最好降低部分依赖包的版本,否则使用过程中可能会出现报错:

pip install paddlespeech==1.4.1
pip install paddlenlp==2.5.2

安装过程参考(中等难度方法):https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/docs/source/install_cn.md

三、报错处理

1、出现报错 TypeError: Descriptors cannot be created directly.

验证是否成功安装 paddlespeech

paddlespeech

报错详情:

TypeError: Descriptors cannot be created directly.
If this call came from a _pb2.py file, your generated code is out of date and must be regenerated with protoc >= 3.19.0.
If you cannot immediately regenerate your protos, some other possible workarounds are:
 1. Downgrade the protobuf package to 3.20.x or lower.
 2. Set PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python (but this will use pure-Python parsing and will be much slower).

More information: https://developers.google.com/protocol-buffers/docs/news/2022-05-06#python-updates

解决方法:

pip install protobuf==3.19.0

参考链接:https://blog.csdn.net/qq_51447436/article/details/125573273

2、出现报错 ImportError: /usr/lib/x86_64-linux-gnu/libc.so.6: version GLIBC_2.32 not found

说明:在使用语音合成功能过程中出现报错。

paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav

解决方法:

pip install opencc-python-reimplemented==0.1.6

参考链接:https://blog.csdn.net/tomjimn/article/details/135013851

3、出现报错 IndexError: list index out of range

每次安装时出现的报错都不太一样,该报错出现过一次,主要是依赖包的问题,注意以下依赖包版本:

paddlenlp                   2.5.2
paddlepaddle                2.4.2
paddlespeech                1.4.1

尝试降低部分依赖包版本后不再报错。

参考链接:https://blog.csdn.net/qq_37016358/article/details/131979815

四、基本功能使用

下载测试音频:

wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/zh.wav
wget -c https://paddlespeech.bj.bcebos.com/PaddleAudio/en.wav
1、语音识别
paddlespeech asr --lang zh --input zh.wav

识别结果:

识别结果

2、语音合成
paddlespeech tts --input "你好,欢迎使用百度飞桨深度学习框架!" --output output.wav

输出:

语音合成

3、声音分类
paddlespeech cls --input zh.wav

输出:

声音分类

4、声纹提取
paddlespeech vector --task spk --input zh.wav

输出:

声纹提取

5、标点恢复
paddlespeech text --task punc --input 今天的天气真不错啊你下午有空吗我想约你一起去吃饭

输出:

标点恢复

6、语音翻译
paddlespeech st --input en.wav

输出:

语音翻译

7、上传自定义文件实现语音识别(英文内容)

此处上传了一个 .wav 的音频文件,内容为单词的发音。

执行命令:

paddlespeech asr --lang en --model deepspeech2offline_librispeech --input numerous.wav

输出:

上传自定义文件实现语音识别(英文内容)

预训练模型:

模型语言转换语言采样率
conformer_wenetspeechFalsezh16k
conformer_online_multicnFalsezh16k
conformer_aishellFalsezh16k
conformer_online_aishellFalsezh16k
transformer_librispeechFalseen16k
deepspeech2online_wenetspeechFalsezh16k
deepspeech2offline_aishellFalsezh16k
deepspeech2online_aishellFalsezh16k
deepspeech2offline_librispeechFalseen16k
conformer_talcsTruezh_en16k

参考链接:https://github.com/PaddlePaddle/PaddleSpeech/blob/develop/demos/speech_recognition/README_cn.md

五、问题补充

1、部分依赖包版本

查看命令:

pip list|grep paddle

指定包查看:

pip show ppdiffusers

部分依赖包版本展示:

paddle-bfloat               0.1.7
paddle2onnx                 1.1.0
paddleaudio                 1.1.0
paddlefsl                   1.1.0
paddlenlp                   2.5.2
paddlepaddle                2.4.2
paddlesde                   0.2.5
paddleslim                  2.6.0
paddlespeech                1.4.1
paddlespeech-ctcdecoders    0.2.1
paddlespeech-feat           0.1.0

ppdiffusers                 0.19.4
Python                      3.8.18
2、重新启动项目后如何进入?

激活 conda

# conda 初始化
$HOME/miniconda3/bin/conda init

# 激活 conda
bash

激活 conda 虚拟环境:

# 进入 PaddleSpeech
cd PaddleSpeech

# 激活 conda 虚拟环境:
conda activate tools/venv

六、参考链接

1、官方资料
2、安装参考
3、报错参考
4、issues
  • 29
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 百度AI Studio是一个基于云计算的人工智能开发平台,支持使用PyTorch进行深度学习模型的开发和训练。用户可以在平台使用PyTorch的各种功能和工具,如自动求导、神经网络模型构建、数据处理等,快速构建和训练自己的深度学习模型。同时,百度AI Studio还提供了丰富的数据集和预训练模型,方便用户进行模型的迁移学习和优化。总之,百度AI Studio是一个非常方便和实用的PyTorch开发平台,适合各种深度学习应用场景。 ### 回答2: 百度aistudio百度公司开发的一个人工智能平台,该平台可以让用户快速创建、训练和部署人工智能模型。在aistudio,用户可以使用多种编程语言和深度学习框架,其之一就是pytorch。 Pytorch是Facebook公司开发的一个深度学习框架,它使用动态图的方式,使得模型定义和调整更加灵活和直观。同时,Pytorch也具有优秀的自动求导功能,使得模型的训练和调整变得更加容易。 在aistudio,用户可以使用pytorch来创建各种类型的深度学习模型,例如卷积神经网络、循环神经网络和自编码器等。此外,aistudio还提供了多种数据集,这些数据集可以用于训练深度学习模型。用户可以通过简单的拖拽操作,将数据集导入到aistudio,并使用pytorch框架来进行数据处理和训练模型。 到目前为止,pytorch已经成为了深度学习领域非常流行的框架之一。它拥有很多优秀的特性和功能,例如支持GPU加速、易于调试和模型可视化等。在aistudio,用户可以充分利用pytorch的这些优势,快速创建高效的深度学习模型,并将其应用于实际场景。 总之,aistudio是一个非常强大的平台,它提供了多种深度学习框架和工具,使得用户能够快速创建、训练和部署人工智能模型。其之一就是pytorch,它是一个非常受欢迎的深度学习框架,可以帮助用户快速实现复杂的深度学习任务。如果你想进一步了解pytorch和aistudio的话,可以在百度上搜索更多相关信息。 ### 回答3: 百度 AI Studio 是一个在线 Python 编程环境,旨在为数据科学、人工智能和深度学习开发人员提供一个完整的解决方案。对于使用 PyTorch 进行深度学习任务的用户,AI Studio 提供了一个非常有用的平台,可以快速部署和测试模型,同时可以共享和协作。 在百度 AI Studio 使用 PyTorch 不仅方便而且高效,用户可以通过 Jupyter Notebook 或 Python 脚本进行开发和实验,在云端上轻松处理和管理数据、训练模型以及进行推断预测。此外,AI Studio 还提供了丰富的开发工具和服务,如模型调节和优化、算法和数据结构优化、多机协同等,有利于提高生产效率和模型质量。 当然,PyTorch 也是百度 AI Studio 的核心技术之一。作为一种开源的 Python 机器学习库,PyTorch 被广泛应用于深度学习研究和工程实践,具有灵活性、易用性和高效性等优势。在 AI Studio ,用户可以选择使用预先构建的 PyTorch 模型或创建他们自己的模型,而且可以运行完整的训练过程,从数据处理、模型构建、训练和推断评估等方面全方位掌握 PyTorch 的使用。 此外,百度 AI Studio 也提供了一系列教学和实践资源,帮助学习者和开发者快速入门 PyTorch,如在线视频课程、研究论文解读、实战案例分享、社区问答等。通过这些资源的学习和实践,用户不仅可以获取深度学习和 PyTorch 的基本知识,还可以掌握深度学习应用场景和技巧,提高实践能力和创新能力,在人工智能领域有所建树。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值