AI之语音转写项目实践
最近项目需要,做了一个语音转写的小demo,结合了微信小程序
前端:微信小程序,录音后上传到服务器
服务器:express作为服务器,multer作为上传中间件,ffmpeg作为格式转换工具,使用百度nodejs的sdk进行语音的转换
语音输入
考虑到需要做语音输入,如果使用HTML5的getUserMedia,兼容性问题有点问题,最近在学微信小程序,索性就直接拿这个项目开撸了。
微信小程序的步骤
- 注册,获取appid 步骤
- 下载微信小程序开发工具
- 新建模板项目
在pages/index/index.wxml
增加录音按钮
<button class="start-record" bindtap="startRecord">开始录音</button>
<button class="stop-record" bindtap="stopRecord">停止录音</button>
<button class="play-record" bindtap="playRecord">播放录音</button>
<button class="upload-record" bindtap="uploadRecord">上传录音</button>
<text class="voice-text">语音转换后的文字:{
{
text}}</text>
在pages/index/index.js
中增加业务逻辑
onLoad中增加init方法,初始化recorderManager和innerAudioContext,分别是录音的管理器和播放语音的管理器
onLoad: function () {
this.init()
// ....
}
init: function() {
const recorderManager = wx.getRecorderManager()
recorderManager.onStart