讯飞小车比赛语音控制
第一次写这玩意可能写的不咋地,主要也是看了一些网上的资料后面给了连接,千万不要骂人,不行我删掉。谢谢
1.硬件层面
本次比赛所使用的麦克风为ucar小车自带的环形六麦克风阵列,该麦克阵列采用平面式分布结构,包六个麦克风可实现 360 度等效拾音,唤醒分辨率为 1度。用户可以使用麦克风阵列获取原始和降噪音频,获取唤醒角度,主麦编号也可以设置主麦编号,灯光点亮和关闭。
在麦克风阵列中,我们一般指定一个主麦来实现指定方向声音加强,其他方向抑制的目的,且降噪音频的获取也基于该主麦方向的。若未主动设置主麦,则主麦方向随机,其获取到的降噪音频不一定基于你说话的方向,这时生成的降噪音频可能不是最优的。用户可通过唤醒或手动设置主麦的方式来设置主麦,以此来提高录音质量。
2.麦克风相关ros包
1.上传音频和关闭上传音频(服务)
服务名称:/xf_asr_offline_node/start_record_srv
服务类型:xf_mic_asr_offline::Start_Record_srv
int8 whether_start
---
string result
string fail_reason
内容:1为开启录音,录音开启即开始上传,0 为关闭音频,关闭音频则停止上传。
2.音频流(话题)
话题名称:/mic/pcm/deno
话题类型:xf_mic_asr_offline/Pcm_msg
Int32 length
char[] pcm_buf
内容:话题内容包括两部分,length 表示 pcm_buf 中的长度,即有效音频的大小,pcm_buf 存放的是指定大小的音频字节。
3.唤醒角度被动(话题)
话题名称&#