静音检测算法优化版本

最新推荐文章于 2024-01-19 21:23:37 发布

百鸣

最新推荐文章于 2024-01-19 21:23:37 发布

阅读量358

点赞数

文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/huapeng_guo/article/details/130066823

版权

这是一个基于频域特征的音频静音检测算法，结合短时能量、过零率、能量谱平坦度和频谱中心性，通过自适应阈值判断，适应不同噪声和音频质量。算法使用FFT计算频域特征，需要链接FFT库，并在实际应用中调整参数和优化。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

以下是一个基于频域特征的音频静音检测算法示例，该算法结合了多个特征并基于自适应阈值进行判断，能够更好地适应不同的噪声和音频质量：

#include <iostream>
#include <fstream>
#include <vector>
#include <cmath>

constexpr int kSampleRate = 16000;    // 采样率
constexpr int kFrameSize = 320;       // 帧大小（20ms）
constexpr int kSilenceDurationThreshold = 400;   // 静音时长阈值（ms）
constexpr double kSilenceEnergyFactor = 0.4;     // 静音能量因子
constexpr double kZcrFactor = 3.5;               // 过零率因子
constexpr double kSpectralFlatnessFactor = 4.5;  // 能量谱平坦度因子
constexpr double kSpectralCentroidFactor = 1.1;  // 频谱中心性因子

double ComputeShortTimeEnergy(const std::vector<short>& frame) {
    long long energy_sum = 0;
    for (const auto& sample : frame) {
        energy_sum += sample * sample;
    }
    return static_cast<double>(energy_sum) / kFrameSize;
}

double ComputeZeroCrossingRate(const std:

最低0.47元/天解锁文章

博客等级

码龄14年

205
原创

463
点赞

1003
收藏

5903
粉丝

关注

私信

热门文章

分类专栏

云计算 2篇
播放器 4篇
rtsp 2篇
WebRTC 2篇
vlc 1篇
ICE 1篇
shell 1篇
C++ 44篇
C 30篇
Windows 操作系统 13篇
Linux操作系统 21篇
Java 1篇
数据结构 3篇
视频智能分析算法 6篇
MFC 3篇
MySQL 1篇
rtp
版本
版本管理
QT
python 8篇
深度学习 2篇
机器学习 3篇
gpu 1篇
cuda 1篇
容器 2篇
samba
网络 1篇

最新评论

obs whip 100ms端到端时延 zlmediakit webrtc验证
自学的小白白: whep是什么播放的呢
SRS WebRTC Whip 和 Whep 部署体验问题
眉梢i: whip推的whep能够播放吗我部署上去看网页whip能推，日志上whip whep的sdp交换这些都成功了，就是拉不到音视频流
Jetson Xavier NX 解码性能评测
weixin_48628145: 大神，源码安装的ffmpeg，在解码时出现段错误，用这个组件也出现段错误，编码器正常。是什么原因呢？
ffmpeg 如何剔除掉视频中的水印和马赛克
MusicTT: 这个我现在在搞，可以用yolov8把你需要遮挡的logo打了标签进行训练，然后对视频进行检测，改一下里面东西就能得到每一帧如果存在需要遮挡logo的坐标位置和帧数。0 3291.89 374.25 404.03 112.87 1~833 1 3380.95 1570.75 328.03 219.08 839~1739 2 3310.29 373.8 367.34 102.33 1745~3542 1 3372.98 1562.32 341.96 228.7 3548~4449 0 3294.76 375.42 396.43 114.37 4454~6253 1 3375.86 1567.24 334.79 221.05 6258~7147 1 3501.97 1576.36 209.5 211.51 7148~7148 第一列是logo标签号，挨着的四个是左上角横坐标、纵坐标、logo宽和logo高，最后是出现的视频帧位置
WebRTC ICE 国内网络的穿透率
烦死地球人: 给你赞一个

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

百鸣 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。