业务实现:使用Microphone录音转换成字节流,通过websocket发送给百度asr接口,接口文档在这里,关于建立websocket连接,发送开始帧参数等不再赘述。
实时语音识别-websocket API - 语音技术百度语音识别,提供业界领先的技术,让您的应用长上耳朵.支持车载导航、智能家居、社交聊天、应用助手、娱乐游戏等,助力企业实现多场景智能语音交互.https://cloud.baidu.com/doc/SPEECH/s/2k5dllqxj
关于音频采样,有两个重要的参数,采样率,百度要求音频采样率为16000,也就时候一秒钟16000个采样点,格式为pcm16,也就是一个采样点16位(两字节),知道这些就可以开始了。
private AudioClip recor