ros下基于百度语音的，语音识别和语音合成

最新推荐文章于 2024-01-28 14:33:58 发布

findhappy117

最新推荐文章于 2024-01-28 14:33:58 发布

阅读量419

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/findhappy117/article/details/82700379

版权

本博客介绍了一个在ROS环境下使用百度语音库实现的语音识别和语音合成的示例。通过安装PyAudio和VLC库，以及ROS，可以实现实时文字转语音和语音转文字功能。项目包含3个节点，分别用于语音合成、触发合成和语音识别。代码和详细步骤可在提供的链接中查看。

摘要由CSDN通过智能技术生成

代码地址如下：
http://www.demodashi.com/demo/13153.html

概述：

本demo是ros下基于百度语音的，语音识别和语音合成，能够实现文字转语音，语音转文字的功能。

详细：

1. 安装库与环境

首先确保已经安装了以下两个库文件。

1.1 Python 音频处理库 PyAudio

python -m pip install pyaudio

1.2 Python 音频处理库 vlc

pip install python-vlc

1.3 ROS

确保安装了ROS
http://wiki.ros.org/indigo

2. 实时语音识别与语音合成

2.1 运行

Speech Recognition（语音识别）:

roslaunch simple_voice simple_voice.launch

Text To Speech（语音合成）:

roslaunch simple_voice simple_speaker.launch

2.2 概述

在运行前先确保安装了python的pyaudio 以及 vlc 库文件.

百度语音识别为开发者提供业界优质且免费的语音服务,通过场景识别优化,,准确率达到90%以上,让您的应用绘“声”绘色。

本文中的语音识别功能：采用百度语音识别库，实现语音转化为文字的功能，并且输出为ros话题。
本文中的语音合成功能：采用百度语音识别库，实现将文字转化为语音并且存储为mp3/wav文件。

2.3 Node

包中一共有3个节点：

node_main.py
simple_speek.py
voice_node.py.

node_main.py 是TTS(Text To Speech)的demo节点, 该demo是和laser scanner一起运行的，当laser检测到一个障碍物，node_main将会触发simple_speek.py让机器说出英语或者汉语 ‘excuse me’, ‘make a way for me pls’或者’请让一下’，等话语。

simple_speek.py 将会订阅 std_msgs/String 消息类型的话题，并且将该话题中输入的文字转化为语音

voice_node.py 将会识别您在5秒内说出的话语并且输出到终端上。

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。