本周对浏览器录音部分进行进一步的实现。
定义函数初始化浏览器录音,首先尝试创建音频环境,判断浏览器是否支持相关接口,以便后续进行相关操作。如果不支持,及时返回错误信息来进行调整。
定义函数用于处理获取媒体成功的情况。首先创建一个对象,这个对象允许js直接处理音频数据,随后设置事件监听器,其会在音频处理时触发,然后创建一个对象,其将用户的麦克风连接到音频处理系统;随后与websocket进行连接即可。
随后开始定义代码实现在网页中请求麦克风的录音权限,并根据权限的请求结果执行不同的操作。首先定义与浏览器的兼容方法,检查相关支持,并使用相关方法来请求权限,如果请求成功,将获取到的对象赋值;如果无法获取录音权限,代码将关闭音频上下文,并返回false。
上述代码都实现完成后,开始尝试向websocket发送数据,首先检查器状态,如果其不可用,则直接返回false,并构建相关发送参数,这些都是请求所必须的。然后将params对象转化为json格式的字符串,发送出去,并持续跟踪当前状态。
总结来说,该函数负责通过WebSocket连接发送音频数据,包括初始化数据和中间帧数据。它使用定时器定期检查WebSocket状态和音频数据,并将数据以Base64编码的形式发送。函数还包含了状态管理和错误处理逻辑,确保在WebSocket未连接或没有数据可发送时能够正确地停止发送过程。
然后定义函数处理通过WebSocket接收到的数据,首先解析收到的json格式字符串,解析为Js对象,如果解析后对象符合要求,那么处理识别结果,并通过讯飞提供的动态修正功能不断更新识别结果。如果服务端处理完毕,便关闭连接,存储最终的识别结果,识别结束。