语音识别—前端录音传给后台语音识别

本文介绍了一个前端录音并将音频通过WebSocket发送到服务器,服务器使用百度AI进行语音识别的过程。项目结构中包含客户端和服务端代码,服务器端通过安装相关依赖并设置接收音频流,前端则利用音频API实现录音并压缩成blob对象发送。识别结果由服务器返回给前端展示。
摘要由CSDN通过智能技术生成

实现前端录音,将音频blob传给服务器,然后在服务器端使用百度AI语音识别将结果返回给前端

上一篇文章是将百度AI语音识别Nodejs SDK版的进行了一遍演示加识别结果返回给前端显示,这里是完整的进行前端录音,然后将压缩后的音频对象Blob传给服务器,在服务端使用百度AI语音识别,最后将识别结果返回给前端进行显示。

本篇调用的是第三方库Recorder.js,如何调用该库捕获HTML5中的WAV音频并将其上传到服务器或者本地下载,可以查看这篇博客,不过它讲解的是上传到PHP服务端,这里我改成了基于Node搭建的Websocket服务器。
这是本篇博客的语音识别结果:
在这里插入图片描述

百度语音识别

查看文档知道了我想要的信息,如果想要实现实时语音识别、长时间段的语音、唤醒词功能、语义解析功能,需要使用AndroidIOS SDK或者Linux C++ SDK版本,而我使用的Nodejs SDK是不支持的。

1、规格参数要求
  • 语音时长上线为60s,超出讲返回错误

  • 原始录音文件为pcmwav或者amr格式,不区分大小写,推荐使用pcm

  • 录音采样率为16000,声道为单通道

  • 支持普通话、英文、粤语、四川话

  • 项目结构

    调用百度AI平台语音识别的Nodejs SDK,查看文档快速入门,可以查看如何调用。

    首先将nodejs-sdk下载下来,下载后将目录里的speech文件夹拷贝到你的项目文件夹中,其中assets是存放录音音频的地方,然后进入node文件夹下的位置进行安装依赖包:

    npm install
    

    我的项目文件夹目录如下:

    audio_asr_baidu
    ├─ package-lock.json
    └─ speech
           ├─ .gitignore
           ├─ assets
           │    ├─ 16k_test.pcm
           │    └─ recorder.wav
           ├─ cpp
           │    ├─ .gitignore
           │    ├─ README.md
           │    ├─ build.sh
           │    └─ main.cpp
           └─ node
                  ├─ .gitignore
                  ├─ README.md
                  ├─ index.html
                  ├─ main.js
                  ├─ node_modules
                  ├─ package-lock.json
                  ├─ package.json
                  └─ style.css
    

    然后在node文件夹里的index.html是我的客户端文件,main.js是我的服务端文件。

搭建Websocket服务器

main.js文件里搭建websocket服务器,首先安装相关依赖模块:

npm i ws -S

然后搭建:

let Server = require('ws').Server;
const wss = new Server({
   
    port: 9001
})
// 连接服务器
wss.on('connection', ws => {
   
    console.log('server connected');

    })
    ws.on('error', error => {
   
        console.log('Error:' + error);

    })
    ws.on('close', () => {
   
        console.log('Websocket is closed');
    })
})
// 断开连接
wss.on('disconnection', ws => {
   
    ws.on('message', msg => {
   
        console.log('server recived msg:' + msg);
    })
})

然后在index.html中:

let ws = new WebSocket('ws://localhost:9001')
  • 3
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值