山东大学软件学院2021级创新项目实训个人工作周报

大三下第十一周

负责部分:前端

本周完成了前端的语音转文字接口的接入,所用接口为微软发布的ASR接口

具体实现细节如下:

本地录音并发送到后端处理

本地麦克风录音通过recorder包处理,并把录制好的音频文件发送到后端(远程服务器)。

这样做有一定优点:

  • 对移动端的负载小。azure的语音识别只接受wav格式的音频文件,而手机录音的格式一般为m4a,若把音频格式转换的任务放到移动端本地来实现,代价过大,会影响使用流畅性。
  • 传输更小的文件。转换后的wav格式文件大小会变成m4a格式的10倍左右,若本地传输wav文件到微软后端,需要传输一个很大的文件;把这个工作交给服务器来做,本地只要发送一个较小的m4a文件就好了。
  • 降低存储。音频文件存储在服务器就好了,本地不需要保存,允许用户反复听。

下面是封装的录音器组件:

后端接收文件并调用Python

Python格式转换并请求语音识别

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值