【Paddle实战】基于PaddleSpeech搭建私人录音转文字服务

环境搭建

安装paddlepaddle和paddleSpeech:

pip install paddlepaddlepip install paddlespeech

PaddleSpeech 是基于飞桨 PaddlePaddle 的语音方向的开源模型库,用于语音和音频中的各种关键任务的开发,包含大量基于深度学习前沿和有影响力的模型,一些典型的应用如下:

  • 声音分类

  • 语音识别

  • 语音翻译

  • 语音合成

相关依赖如下:

  • gcc >= 4.8.5

  • paddlepaddle >= 2.3.1

  • python >= 3.7

  • linux(推荐), mac, windows

  • win必须安装Microsoft C++生成工具

命令行调用

语音分类

paddlespeech cls --input 1.mp3

图片

一段python办公自动化抖音广告语,因为有背景音乐,所以判断为Music。

语音识别

图片

这段广告语被完整识别出来,唯一的问题是不带标点符号。

语音翻译(英翻中)

paddlespeech asr --lang zh --input input_16k.wav

windows暂不支持,但是linux可以。

语音合成

paddlespeech tts --input "你好,欢迎关注电力数据新应用!" --output output.wav

图片

自动生成语音,大数据工匠,2秒

API调用语音识别​​​​​​​

from paddlespeech.cli.asr.
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值