ROSECHO 中文ROS语音交互模块(一)
ROSECHO 开源项目
中文ROS语音交互模块
“听说”,你的机器人还没有耳朵?
概述
ROSECHO是一款支持ROS的语音交互开发模块,基于讯飞的AIUI平台,软件开源。使用ROSECHO,可以快速为ROS机器人开发出商业级的语音交互功能。
如果你想为自己的ROS移动机器人增加“听”和“说”的能力,那么可以选择ROSECHO。为机器人增加语音交互功能就像增加激光雷达一样简单,即插即用,将“听”到的语音转换为文字,将想要“说”的文字转换为语音。专业团队进行驱动开发并且代码全部开源,还有持续不断更新的Demo程序。
借助科大讯飞的AIUI开发平台,ROSECHO已经具有语音唤醒、语音识别、语义理解、内容(问答)系统、语音合成等功能,并且实现了语音降噪、回声消除、全双工交互的软硬件设计。可以极大缩短使用ROS的智能机器人上的语音交互系统开发时间,提高语音交互的准确度和用户体验。需要更多了解科大讯飞AIUI产品,可以参考AIUI硬件解决方案白皮书。
ROSECHO采用软硬一体的AIUI集成方式,语音交互处理都集成在模块内部,对于用户来说就是一个串口设备,相比纯软核方式优势明显:
- ROSECHO可以适配不同上位机架构,无论x86还ARM都能够直接驱动。 不需要上位机实时内核。不占用系统资源。
- 云端对话、唤醒词、发音人都是在ROSECHO上进行配置,接入新的机器人上位机并不会改变语音设置。
- 硬件实现回声消除和降噪,实现更高的唤醒率和更准确的语音识别,尤其是在远场拾音的情况下,更适合智能机器人的开发。
- 云端的通用语料库由讯飞维护,与机器人相关的语料由天之博特官方维护。用户 可以轻松享受功能升级。
硬件
语音处理:科大讯飞AIUI核心板
喇叭:8W
电源:12V
USB接口:MicroUSB
麦克风:六环麦
软件
云端:科大讯飞iFlyOS(无需用户维护)
AIUI SDK: 5.5.1057.1220 (供深度开发者维护)
ROS功能包:https://g