【Paddle实战】基于PaddleSpeech搭建私人录音转文字服务

最新推荐文章于 2025-03-07 16:11:08 发布

全栈海哥

最新推荐文章于 2025-03-07 16:11:08 发布

阅读量2.1k

点赞数 5

文章标签： paddle

本文链接：https://blog.csdn.net/qq_39172059/article/details/136608055

版权

环境搭建

安装paddlepaddle和paddleSpeech：

pip install paddlepaddlepip install paddlespeech

PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型，一些典型的应用如下：

声音分类
语音识别
语音翻译
语音合成

相关依赖如下：

gcc >= 4.8.5
paddlepaddle >= 2.3.1
python >= 3.7
linux(推荐), mac, windows
win必须安装Microsoft C++生成工具

命令行调用

语音分类

paddlespeech cls --input 1.mp3

一段python办公自动化抖音广告语，因为有背景音乐，所以判断为Music。

语音识别

这段广告语被完整识别出来，唯一的问题是不带标点符号。

语音翻译（英翻中）

paddlespeech asr --lang zh --input input_16k.wav

windows暂不支持，但是linux可以。

语音合成

paddlespeech tts --input "你好，欢迎关注电力数据新应用！" --output output.wav

自动生成语音,大数据工匠,2秒

API调用语音识别

from paddlespeech.cli.asr.

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

全栈海哥

关注关注

5
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

paddlespeech asr语音转录文字；FunASR使用；sherpa 实时、离线、rtsp流语音转录

weixin_42357472的博客

06-18

4854

音频转文字哪家强？faster-whisper还是paddlespeech,我的折腾吐槽记录

weixin_42722350的博客

07-24

2563

我这次的记录目的就是如何使用GPU折腾faster-whisper，这里边还是有几个注意事项的

参与评论您还未登录，请先登录后发表或查看评论

一键智能视频语音转文本——基于PaddlePaddle语音识别与Python轻松提取视频语音并生成文案

知来者逆的博客

09-30

8912

这个项目的核心算法是基于PaddlePaddle的语音识别加Python实现了一键从视频转成文本的功能，项目支持可以处理短语音识别、长语音识别、实现输入的语音识别，项目有完整的代码，带UI界面。

基于paddlespeech实现的字幕生成功能

最新发布

abments的博客

03-07

520

视频字幕生成可以使用语音识别系统从特定视频生成字幕。这个 demo 是一个为视频自动生成字幕的实现，它可以通过使用的单个命令或 python 中的几行代码来实现。

paddle实现语音转文字

kewei chen

04-30

1800

pip install paddlepaddle-gpu==2.2.1.post101 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html #升级paadlepaddle-gpu pip install paddlespeech git clone https://gitee.com/qmckw/audio-to-text.git#克隆主仓 cd audio-to-text pip install tqdm==4.64.0 py.

paddle-语音转文本

zj850324的博客

05-10

776

【代码】paddle-语音转文本。

【飞桨PaddleSpeech语音技术课程】— 一句话语音合成全流程实践

小湉湉的博客

10-31

5368

【飞桨PaddleSpeech语音技术课程】— 一句话语音合成全流程实践

基于百度开源PaddleSpeech模型的一个电话录音文本转译项目

02-15

获取文件对象 # 获取路径下所有文件或文件夹——生成器 import os def get_file_name(dir_path:str): # 二阶文件夹数据获取 file_list = os.listdir(dir_path) for dir in file_list: file_dir_path = os....

【Paddle笔记】搭建PaddleSpeech API语音服务器

老富的博客

05-02

2184

自动启用conda环境自动cd到paddlespeech目录自动输入cli命令及config_filecd ~vim mypss自行修改当中的文件路径和conda环境名/bin/bash。

尝试搭建本地语音转文字系统[1]

csz的博客

08-06

4133

自己安装的简单记录，主要是记录，能帮助他人是最好的

【paddle】Helloworld-文字转语音

oJuHao12345的专栏

09-02

1032

桨(PaddlePaddle)是集深度学习核心框架、工具组件和服务平台为一体的技术先进、功能完备的开源深度学习平台

PaddlePaddle-DeepSpeech中文语音识别模型（AISHELL数据集训练的）

03-18

PaddlePaddle-DeepSpeech中文语音识别模型（AISHELL数据集训练的）项目地址：https://github.com/yeyupiaoling/PaddlePaddle-DeepSpeech/tree/release/1.0

【语音识别】搭建本地的语音转文字系统：FunASR（离线不联网即可使用）

热门推荐

qq_37280924的博客

04-24

1万+

阿里达摩院。

Python使用PaddleSpeech实现语音识别（ASR）、语音合成（TTS）

wozuishuai_的博客

03-21

7108

PaddleSpeech是百度飞桨开发的语音工具。

FastGPT 调用本地Whisper模型进行语音转文字

yixiuquan的博客

04-24

6551

fastgpt默认的语音转文字模型使用的openai里面的，由于我没有token故需要自己部署，经研究发现可以部署本地的whisper，但是该接口无法接入到oneapi（我目前没研究出来）。注：fastgpt的麦克风权限是本地部署的才能用，或者有HTTPS证书的才可以用（麦克风权限比较重要可能涉及隐私，故浏览器对这个要求比较严格）。3、找到要修改的文件并修改，一般容器都没有安装vim\nano等编辑器。将 `:` 替换为你要保存的新镜像的名称和标签。

基于PaddleSpeech搭建个人语音听写服务

Maisuluo的博客

07-29

8621

之基于PaddleSpeech搭建个人语音听写服务，顾名思义，是通过PaddleSpeech来搭建语音听写服务的，主要思路如下。 1.录音长度切分 2.录音听写 3.录音文本加标点

AI语音模型PaddleSpeech踩坑（安装）指南

不二的AI笔记

05-12

6180

PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型。要找到一个合适的PaddleSpeech版本与paddlepaddle适配非常困难！官方文档也没有明确告诉我们PaddleSpeech要与哪个版本的python、paddlepaddle、cuda版本适配，只能自己尝试。经过N多次尝试，终于找到了能用的版本。因此，请严格按照下文的步骤执行。

【飞桨PaddleSpeech语音技术课程】— 语音识别-流式服务-模型部分

小湉湉的博客

10-28

2757

【飞桨PaddleSpeech语音技术课程】— 语音识别-流式服务-模型部分

人工智能-语音识别技术paddlespeech的搭建和使用

没刮胡子的程序员专栏

12-05

3183

PaddleSpeech是百度飞桨（PaddlePaddle）开源深度学习平台的其中一个项目，它基于飞桨的语音方向模型库，用于语音和音频中的各种关键任务的开发，包含大量基于深度学习前沿和有影响力的模型。PaddleSpeech支持语音识别、语音翻译（英译中）、语音合成、标点恢复等应用示例。

YOLOX目标检测算法Paddle实现与实战源码分享

资源摘要信息:"YOLOX-基于Paddle实现的YOLOX目标检测算法-附项目源码-优质项目实战.zip" YOLOX是一种目标检测算法，它是You Only Look Once（YOLO）系列目标检测模型的最新变种。YOLO系列算法以其快速和准确的特点...