SenseVoice部署(Windows环境)+ 简易api二次开发:实现麦克风语音识别

SenseVoice是什么
 

摘抄自README文档SenseVoice/README_zh.md at main · FunAudioLLM/SenseVoice (github.com)icon-default.png?t=N7T8https://github.com/FunAudioLLM/SenseVoice/blob/main/README_zh.md

SenseVoice 是具有音频理解能力的音频基础模型,包括语音识别(ASR)、语种识别(LID)、语音情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。本项目提供 SenseVoice 模型的介绍以及在多个任务测试集上的 benchmark,以及体验模型所需的环境安装的与推理方式。

对比目前主流的FastWhisper模型,在small模型上,SenseVoice额外提供了情感和事件,况且情感的识别率比一些开源的语音情感分类准确率高(虽然我觉得还是差点意思)。
况且,Se(后简称同)的识别速度比Fa快了很多,短文本(20以下)能做到百毫秒内。

缺点在于,Se的large版本是没有开源的,而Fa的三个版本均开源,目前普遍认为large和medium的生产效果差不多,消耗时间是以秒为单位的。看官方给出的表格来说,Se的large和Fa的性能几乎相同。
 

部署

默认会使用Anaconda或者miniconda虚拟环境

#克隆仓库
git clone https://github.com/FunAudioLLM/SenseVoice.git
cd SenseVoice
#创建虚拟环境
conda create -n sensevoice python=3.10 
conda activate sensevoice 
#在虚拟环境
### ESP32 部署 SenseVoice 使用教程及配置方法 #### 一、准备工作 为了在ESP32上成功部署SenseVoice,需准备如下硬件和软件环境: - **硬件需求** - 支持I2S接口的麦克风模块。 - ESP32开发板。 - **软件工具链** - 安装最新版本的Arduino IDE并添加ESP32支持[^2]。 #### 二、安装必要的库文件 要在ESP32项目中集成SenseVoice功能,需要下载对应的SDK包以及依赖项。通常情况下,官方会提供详细的文档说明如何获取这些资源。按照官方指南完成相关库的导入工作。 #### 三、初始化音频设备 通过I2S总线连接外部麦克风到ESP32,并编写相应的驱动程序来读取来自麦克风的数据流。这部分涉及到具体的电路设计细节,在此不做过多展开[^1]。 ```cpp #include "driver/i2s.h" // I2S configuration parameters #define I2S_NUM I2S_NUM_0 #define I2S_BCK_IO 26 /*!< GPIO number of I2S bit clock signal */ #define I2S_WS_IO 25 /*!< GPIO number of I2S word select signal */ #define I2S_DATA_IN_IO 22 /*!< GPIO number of I2S data input signal */ void setup() { i2s_config_t i2s_config = { .mode = (i2s_mode_t)(I2S_MODE_MASTER | I2S_MODE_RX), ... }; } ``` #### 四、加载SenseVoice模型 根据所选的具体语音识别方案,预先训练好的神经网络权重会被固化至Flash存储器内;启动时将其映射入SRAM以便快速访问。对于某些轻量级的应用场景而言,也可以考虑直接在线传输参数给MCU处理[^3]。 #### 五、实现命令词检测逻辑 当接收到有效的声音片段后,调用预置API执行特征提取与分类操作,最终返回匹配度最高的关键词作为输出结果。这里可以利用中断机制提高响应速度,确保及时捕捉用户的指令输入。 ```cpp if (sensevoice_recognize(buffer)) { // buffer contains audio samples collected by microphone Serial.println("Keyword detected!"); } ```
评论 10
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值