声音识别
文章平均质量分 85
等待整个冬天
AI芯片研究僧
展开
-
声音特征提取--Demon谱分析(舰船水声)
不同频带的DEMON谱线相互之间也不一样,有的频带内会发生线谱遗失,有的频带内的线谱并不是真正的谱线。当舰船航速达到某个极限时,螺旋桨的高速旋转将产生空化噪声,由螺旋桨产生的一系列周期信号被空化噪声调制,在频域上表现为将低频的离散线谱线性搬移到较高频率噪声所处的频率周围,这些周期信号在频域是离散的线谱系列,对应舰船的轴频、叶频以及谐波频率,由于舰船辐射噪声低频部分还有其它噪声源,很难从低频段直接提取出螺旋桨产生的线谱系列,而是要先对高频段的调制信号进行解调,通过低通滤波得到信号的低频包络谱,即。原创 2024-01-02 17:45:25 · 1740 阅读 · 1 评论 -
舰船辐射噪声机理分析
当螺旋桨叶片形状不规范,或桨叶边缘粗糙时,叶片附近会出现卡门涡线性,将叶片看作一个弹性体,自由度是N,螺旋桨叶片存在多个固有频率,当卡门涡与螺旋桨分离时的频率与螺旋桨叶片某个固有频率一样时,会发生一起振动的现象,即**“唱音**”。为线谱、连续谱和调制谱的混合,可以将噪声大致分为3类,分别为机械设备振动发出的噪声(机械噪声)、螺旋桨旋转推进驱动发出的噪声(螺旋桨噪声)、以及周围流体对舰船作用发出的噪声(水动力噪声),螺旋桨叶片的m次谐波频率,m为相应的谐波次数,n为桨叶的数量,s为螺旋桨转速。原创 2023-12-29 17:34:25 · 1034 阅读 · 1 评论 -
声音特征提取--Mel梅尔频谱、梅尔倒谱系数MFCC
主要频率成分包含了声音的识别属性,在声目标识别时,我们需要找到共振峰的位置还有它们转变的过程,所以我们提取的是频谱的包络:一条连接共振峰点的平滑曲线。但是人耳感知到的声音高低与声音的原始频率并不呈线性关系,人耳对低频声音更加敏感,低频区域的差异变化比较容易被感受,而对于高频声音的变化感知并不明显。比如10hz和110hz的声音,人耳能够明显感觉到不同,而1000hz和1100hz的声音,人耳感觉会是一样的。这样使得在Mel刻度上相等距离的两对频度,人耳的感知差异也是相同的,即人耳感知和梅尔尺度呈线性关系。原创 2023-12-26 16:21:14 · 1300 阅读 · 1 评论 -
声音特征提取-STFT短时傅里叶变换
分帧的窗口长度决定了变换后时频图的时间分辨率和频率分辨率,窗长越长,截取到的信号越长,变换后频率分辨率越高,但是时间分量之间的距离则变大了,信号的短时变化特征无法很好的反应出来;频域公式表述了信号在不同频率上的成分,通过连接每个窗口随时间变化的幅度谱,则获得了信号的时频表示。:将长时非平稳信号加窗进行短时分割,在短时内信号可以视作平稳信号,可以进行FT变换,通过窗函数的滑动得到每一个窗口内信号的傅里叶变换结果,这些结果堆叠起来排开,得到的就是一个二维的时频域特征图,表征了整个信号在时间和频率上的分布。原创 2023-12-24 16:39:23 · 572 阅读 · 0 评论 -
基于深度学习的语音信号处理基础
【1】维涅斯的大火花. [天子学习]深度学习中的语音信号处理基础&代码实现[EB/OL]. [2023.10.30]. https://www.bilibili.com/video/BV1f3411C7kb/?基频说明了声带发出的声音的(基音)振动的频率变化,而共振峰说明了声带发出的基音与声道谐振的声音的频率的变化。n_fft/2+1:每帧可以提取到176组不同的幅度相位,win_length/采样率:每两个频率间隔。则整张图可表示语音信号的各个频率分量随着时间变化,其幅度的强弱的变化。原创 2023-10-30 18:09:33 · 170 阅读 · 4 评论 -
语音信号特征提取详解-MFCC、FBank、Mel谱
如何训练一个声纹识别模型:从原理到实践”,第二章:训练数据的格式与加载方法[EB/OL]. [2023.10.30]. https://www.bilibili.com/video/BV19q4y137i4/?语音分帧后,需要在时域乘以窗函数以增加帧左端和右端的连续性,减少频谱泄露,使窗口两端不会急剧变化而平滑过渡到0,从而使截出的语音波形帧缓慢降为0,减小语音帧的截断效应。在梅尔滤波器构建完成后,要得到梅尔倒谱能量,还需要对傅里叶变换后的频率谱执行 Mel 滤波运算,以计算每阶滤波器的能量和总能量值。原创 2023-10-30 11:38:29 · 521 阅读 · 0 评论