大三下第十一周
负责部分:前端
本周完成了前端的语音转文字接口的接入,所用接口为微软发布的ASR接口
具体实现细节如下:
本地录音并发送到后端处理
本地麦克风录音通过recorder
包处理,并把录制好的音频文件发送到后端(远程服务器)。
这样做有一定优点:
- 对移动端的负载小。
azure
的语音识别只接受wav
格式的音频文件,而手机录音的格式一般为m4a
,若把音频格式转换的任务放到移动端本地来实现,代价过大,会影响使用流畅性。 - 传输更小的文件。转换后的
wav
格式文件大小会变成m4a
格式的10倍左右,若本地传输wav
文件到微软后端,需要传输一个很大的文件;把这个工作交给服务器来做,本地只要发送一个较小的m4a
文件就好了。 - 降低存储。音频文件存储在服务器就好了,本地不需要保存,允许用户反复听。
下面是封装的录音器组件: