VAD算法

最新推荐文章于 2024-08-10 07:52:20 发布

我把葡萄酿成酒

最新推荐文章于 2024-08-10 07:52:20 发布

阅读量1.4w

点赞数 2

分类专栏：信号处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ffmpeg4976/article/details/52416317

版权

VAD算法

基于信噪比（snr）的vad
基于DNN的vad
基于能量Energy的vad
基于Decoder的Vad
混合DNN和Decoder的Vad

基于信噪比的VAD算法

首先假设初始时的人是没有说话的，计算12帧初始声音的平均能量作为baseline，这个能量相当于底噪。

若进入的一帧的rms大于这个baseline，认为有人声，否则认为无人声。

初始时，连续n秒无人声，认为用户没有说话；连续3帧有声音，认为开始说话；说话后，又连续n秒没有声音，认为用户停止说话。

这就是几个状态处理，用个简单的状态机即可，switch， case。

用一个窗户来计算有声和无声的帧。

如何计算音量的呢？先计算一帧的rms，再10log（S/N）

private float getRmsdB(float rms) {
    if (mNoiseLevel < rms) {
        mNoiseLevel = (0.999f * mNoiseLevel) + (0.001f * rms);
    } else {
        mNoiseLevel = (0.95f * mNoiseLevel) + (0.05f * rms);
    }
    if (((double) mNoiseLevel) <= 0.0d || ((double) (rms / mNoiseLevel)) <= 1.0E-6d) {
        return -120.0f;
    }
    float originalDb

最低0.47元/天解锁文章

我把葡萄酿成酒

关注

2
点赞
踩
28

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

我把葡萄酿成酒 CSDN认证博客专家 CSDN认证企业博客

码龄10年

198: 原创

12万+: 周排名

80万+: 总排名

52万+: 访问

: 等级

5970: 积分

273: 粉丝

154: 获赞

29: 评论

655: 收藏

私信

关注

热门文章

分类专栏

架构设计 6篇
设计模式 6篇
算法 22篇
Leetcode 59篇
操作系统 16篇
C/C++/JAVA 17篇
APP 10篇
Audio系统 24篇
驱动 2篇
工程实践 14篇
软件工程 9篇
蓝牙 1篇
稳定性 1篇
Alarm 1篇
编译系统 1篇
故事 4篇
Android Framework 3篇
语音识别 5篇
信号处理 10篇
性能优化 3篇

最新评论

VAD算法
要努力的大倩: 博主能分享下完整代码吗？qq邮箱：3411997693@qq.com
核间通信原理
YBayMax: 间接的共享内存快一点，但是共享内存缺乏同步机制，需要一些指令来保证各核之间访问共享内存不冲突。
蓝牙流程介绍
liwb0120: 清风和艾克姆蓝牙开发板资料，有需要的可以下载「蓝牙开发板」https://www.aliyundrive.com/s/Ui9QiBN3yQx 点击链接保存，或者复制本段内容，打开「阿里云盘」APP ，无需下载极速在线查看，视频原画倍速播放。
VAD算法
MessyPaste: 语言简洁
字节序
qq_41499720: 请问audio Record 读出的short 数据是大端的吗？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。